[25654] 2016-10-28_构建你的数据科学作品集:机器学习项目(下)

文档创建者:s7ckTeam
浏览次数:1
最后更新:2025-01-19
2016-10-28_构建你的数据科学作品集:机器学习项目(下) 0 3 % 0 8 % 1 6 % 1 8 % 2 4 % 2 7 % 3 4 % 3 6 % 5 2 % 6 2 % 6 4 % 7 1 % 7 4 % 7 8 % 8 3 % 8 6 % 8 8 % 9 2 % 9 3 %   k / z / v / c / i   L i n u x   2 0 1 6 - 1 0 - 2 8   #   , 2 0 - - - - - - - - - - - - - - - - - -   R E A D M E - [ 1 ] D a t a   S c i e n c e   P o r t f o l i o [ 2 ]                                   p r o c e s s e d / P e r f o r m a n c e . t x t f o r e c l o s u r e _ d a t e N o n e f o r e c l o s u r e _ d a t e f o r e c l o s u r e _ d a t e f o r e c l o s u r e _ s t a t u s i d p e r f o r m a n c e _ c o u n t i d
  P a n d a s     g r o u p b y [ 3 4 ]     D a t a F r a m e                     1 2 9 2 3 6 0 9 4     D a t a F r a m e   使   a p p l y [ 3 5 ]         1 2 9 2 3 6 0 9 4   访                               使           使             1         f o r e c l o s u r e _ s t a t u s `   4 .   i d i d f o r e c l o s u r e _ d a t e N o n e i d i d i d f o r e c l o s u r e _ d a t e N o n e f o r e c l o s u r e _ s t a t u s p e r f o r m a n c e _ c o u n t a n n o t a t e . p y c o u n t _ p e r f o r m a n c e _ r o w s p r o c e s s e d / P e r f o r m a n c e . t x t | l o a n _ i d l o a n _ i d p e r f o r m a n c e _ c o u n t d a t e N o n e   1 .   i m p o r t   o s 2 .   i m p o r t   s e t t i n g s 3 .   i m p o r t   p a n d a s   a s   p d
使                       g e t [ 3 6 ]     5 .   d e f   c o u n t _ p e r f o r m a n c e _ r o w s ( ) : 6 .           c o u n t s   =   { } 7 .           w i t h   o p e n ( o s . p a t h . j o i n ( s e t t i n g s . P R O C E S S E D _ D I R ,   " P e r f o r m a n c e . t x t " ) ,   ' r ' )   a s   f : 8 .                   f o r   i ,   l i n e   i n   e n u m e r a t e ( f ) : 9 .                           i f   i   = =   0 : 1 0 .                                   #   S k i p   h e a d e r   r o w 1 1 .                                   c o n t i n u e 1 2 .                           l o a n _ i d ,   d a t e   =   l i n e . s p l i t ( " | " ) 1 3 .                           l o a n _ i d   =   i n t ( l o a n _ i d ) 1 4 .                           i f   l o a n _ i d   n o t   i n   c o u n t s : 1 5 .                                   c o u n t s [ l o a n _ i d ]   =   { 1 6 .                                           " f o r e c l o s u r e _ s t a t u s " :   F a l s e , 1 7 .                                           " p e r f o r m a n c e _ c o u n t " :   0 1 8 .                                   } 1 9 .                           c o u n t s [ l o a n _ i d ] [ " p e r f o r m a n c e _ c o u n t " ]   + =   1 2 0 .                           i f   l e n ( d a t e . s t r i p ( ) )   >   0 : 2 1 .                                   c o u n t s [ l o a n _ i d ] [ " f o r e c l o s u r e _ s t a t u s " ]   =   T r u e 2 2 .           r e t u r n   c o u n t s l o a n _ i d k e y 1 .   d e f   g e t _ p e r f o r m a n c e _ s u m m a r y _ v a l u e ( l o a n _ i d ,   k e y ,   c o u n t s ) : 2 .           v a l u e   =   c o u n t s . g e t ( l o a n _ i d ,   { 3 .                   " f o r e c l o s u r e _ s t a t u s " :   F a l s e , 4 .                   " p e r f o r m a n c e _ c o u n t " :   0 5 .           } ) 6 .           r e t u r n   v a l u e [ k e y ] c o u n t s f o r e c l o s u r e _ s t a t u s p e r f o r m a n c e _ c o u n t a n n o t a t e . p y
  :             .     (                   a n n o t a t e . p y p e r f o r m a n c e _ c o u n t f o r e c l o s u r e _ s t a t u s p e r f o r m a n c e _ c o u n t R S f i r s t _ p a y m e n t _ d a t e o r i g i n a t i o n _ d a t e a c q u i s i t i o n f o r e c l o s u r e _ s t a t u s c o u n t s a c q u i s i t i o n
                                  1 5 .   p e r f o r m a n c e _ c o u n t c o u n t s c h a n n e l s e l l e r f i r s t _ t i m e _ h o m e b u y e r l o a n _ p u r p o s e p r o p e r t y _ t y p e o c c u p a n c y _ s t a t u s p r o p e r t y _ s t a t e p r o d u c t _ t y p e f i r s t _ p a y m e n t _ d a t e o r i g i n a t i o n _ d a t e m o n t h y e a r f i r s t _ p a y m e n t _ m o n t h f i r s t _ p a y m e n t _ y e a r r i g i n a t i o n _ m o n t h o r i g i n a t i o n _ y e a r - 1 1 .   d e f   a n n o t a t e ( a c q u i s i t i o n ,   c o u n t s ) : 2 .           a c q u i s i t i o n [ " f o r e c l o s u r e _ s t a t u s " ]   =   a c q u i s i t i o n [ " i d " ] . a p p l y ( l a m b d a   x :   g e t _ p e r f o r m a n c e _ s u m m a r y _ v a l u e ( x ,   " f o r e c l o s u r e _ s t a t u s " ,   c o u n t s ) ) 3 .           a c q u i s i t i o n [ " p e r f o r m a n c e _ c o u n t " ]   =   a c q u i s i t i o n [ " i d " ] . a p p l y ( l a m b d a   x :   g e t _ p e r f o r m a n c e _ s u m m a r y _ v a l u e ( x ,   " p e r f o r m a n c e _ c o u n t " ,   c o u n t s ) ) 4 .           f o r   c o l u m n   i n   [ 5 .                   " c h a n n e l " , 6 .                   " s e l l e r " , 7 .                   " f i r s t _ t i m e _ h o m e b u y e r " , 8 .                   " l o a n _ p u r p o s e " , 9 .                   " p r o p e r t y _ t y p e " , 1 0 .                   " o c c u p a n c y _ s t a t u s " , 1 1 .                   " p r o p e r t y _ s t a t e " , 1 2 .                   " p r o d u c t _ t y p e " 1 3 .           ] : 1 4 .                   a c q u i s i t i o n [ c o l u m n ]   =   a c q u i s i t i o n [ c o l u m n ] . a s t y p e ( ' c a t e g o r y ' ) . c a t . c o d e s 1 6 .           f o r   s t a r t   i n   [ " f i r s t _ p a y m e n t " ,   " o r i g i n a t i o n " ] : 1 7 .                   c o l u m n   =   " { } _ d a t e " . f o r m a t ( s t a r t )
2 1 .                   D a t a F r a m e   D a t a F r a m e     4 .   7 .             [ 3 7 ]   1 8 .                   a c q u i s i t i o n [ " { } _ y e a r " . f o r m a t ( s t a r t ) ]   =   p d . t o _ n u m e r i c ( a c q u i s i t i o n [ c o l u m n ] . s t r . s p l i t ( ' / ' ) . s t r . g e t ( 1 ) ) 1 9 .                   a c q u i s i t i o n [ " { } _ m o n t h " . f o r m a t ( s t a r t ) ]   =   p d . t o _ n u m e r i c ( a c q u i s i t i o n [ c o l u m n ] . s t r . s p l i t ( ' / ' ) . s t r . g e t ( 0 ) ) 2 0 .                   d e l   a c q u i s i t i o n [ c o l u m n ] 2 2 .           a c q u i s i t i o n   =   a c q u i s i t i o n . f i l l n a ( - 1 ) 2 3 .           a c q u i s i t i o n   =   a c q u i s i t i o n [ a c q u i s i t i o n [ " p e r f o r m a n c e _ c o u n t " ]   >   s e t t i n g s . M I N I M U M _ T R A C K I N G _ Q U A R T E R S ] 2 4 .           r e t u r n   a c q u i s i t i o n a n n o t a t e . p y p r o c e s s e d / t r a i n . c s v p y t h o n   a n n o t a t e . p y c o u n t s a c q u i s i t i o n a c q u i s i t i o n t r a i n . c s v 1 .   d e f   r e a d ( ) : 2 .           a c q u i s i t i o n   =   p d . r e a d _ c s v ( o s . p a t h . j o i n ( s e t t i n g s . P R O C E S S E D _ D I R ,   " A c q u i s i t i o n . t x t " ) ,   s e p = " | " ) 3 .           r e t u r n   a c q u i s i t i o n 5 .   d e f   w r i t e ( a c q u i s i t i o n ) : 6 .           a c q u i s i t i o n . t o _ c s v ( o s . p a t h . j o i n ( s e t t i n g s . P R O C E S S E D _ D I R ,   " t r a i n . c s v " ) ,   i n d e x = F a l s e ) 8 .   i f   _ _ n a m e _ _   = =   " _ _ m a i n _ _ " : 9 .           a c q u i s i t i o n   =   r e a d ( ) 1 0 .           c o u n t s   =   c o u n t _ p e r f o r m a n c e _ r o w s ( ) 1 1 .           a c q u i s i t i o n   =   a n n o t a t e ( a c q u i s i t i o n ,   c o u n t s ) 1 2 .           w r i t e ( a c q u i s i t i o n ) p y t h o n   a n n o t a t e . p y t r a i n . c s v a n n o t a t e . p y
      3 .     a n n o t a t e . p y 1 .   l o a n - p r e d i c t i o n 2 .     d a t a 3 .           A c q u i s i t i o n _ 2 0 1 2 Q 1 . t x t 4 .           A c q u i s i t i o n _ 2 0 1 2 Q 2 . t x t 5 .           P e r f o r m a n c e _ 2 0 1 2 Q 1 . t x t 6 .           P e r f o r m a n c e _ 2 0 1 2 Q 2 . t x t 7 .           . . . 8 .     p r o c e s s e d 9 .           A c q u i s i t i o n . t x t 1 0 .           P e r f o r m a n c e . t x t 1 1 .           t r a i n . c s v 1 2 .     . g i t i g n o r e 1 3 .     a n n o t a t e . p y 1 4 .     a s s e m b l e . p y 1 5 .     R E A D M E . m d 1 6 .     r e q u i r e m e n t s . t x t 1 7 .     s e t t i n g s . p y f o r e c l o s u r e _ s t a t u s 1 .   i m p o r t   p a n d a s   a s   p d 2 .   i m p o r t   s e t t i n g s 4 .   t r a i n   =   p d . r e a d _ c s v ( o s . p a t h . j o i n ( s e t t i n g s . P R O C E S S E D _ D I R ,   " t r a i n . c s v " ) ) 5 .   t r a i n [ " f o r e c l o s u r e _ s t a t u s " ] . v a l u e _ c o u n t s ( ) 1 .   F a l s e         4 6 3 5 9 8 2 2 .   T r u e                 1 5 8 5 3 .   N a m e :   f o r e c l o s u r e _ s t a t u s ,   d t y p e :   i n t 6 4
使   1     2   5 0 %   使 使 3   1     2     3   1     3     2   2     3     1 使 S c i k i t - l e a r n [ 3 8 ]     c r o s s v a l p r e d i c t [ 3 9 ]   . [ 4 0 ]             [ 4 1 ] 使 使   s c i k i t - l e a r n   [ 4 2 ] 使   [ 4 3 ]         c o u n t s   使   F a l s e f o r e c l o s u r e _ s t a t u s T r u e F a l s e f a l s e c l a s s _ w e i g h t b a l a n c e d f a l s e
    使         使             D a t a F r a m e 7 .   1 0 .   1 3 .     使   s c i k i t - l e a r n         便   D a t a F r a m e p r e d i c t . p y t r a i n . c s v c r o s s _ v a l i d a t e i d f o r e c l o s u r e _ s t a t u s t r a i n 1 .   i m p o r t   o s 2 .   i m p o r t   s e t t i n g s 3 .   i m p o r t   p a n d a s   a s   p d 4 .   f r o m   s k l e a r n   i m p o r t   c r o s s _ v a l i d a t i o n 5 .   f r o m   s k l e a r n . l i n e a r _ m o d e l   i m p o r t   L o g i s t i c R e g r e s s i o n 6 .   f r o m   s k l e a r n   i m p o r t   m e t r i c s 8 .   d e f   c r o s s _ v a l i d a t e ( t r a i n ) : 9 .           c l f   =   L o g i s t i c R e g r e s s i o n ( r a n d o m _ s t a t e = 1 ,   c l a s s _ w e i g h t = " b a l a n c e d " ) 1 1 .           p r e d i c t o r s   =   t r a i n . c o l u m n s . t o l i s t ( ) 1 2 .           p r e d i c t o r s   =   [ p   f o r   p   i n   p r e d i c t o r s   i f   p   n o t   i n   s e t t i n g s . N O N _ P R E D I C T O R S ] 1 4 .           p r e d i c t i o n s   =   c r o s s _ v a l i d a t i o n . c r o s s _ v a l _ p r e d i c t ( c l f ,   t r a i n [ p r e d i c t o r s ] ,   t r a i n [ s e t t i n g s . T A R G E T ] ,   c v = s e t t i n g s . C V _ F O L D S ) 1 5 .           r e t u r n   p r e d i c t i o n s c o m p u t e _ e r r o r f o r e c l o s u r e _ s t a t u s c o m p u t e _ f a l s e _ n e g a t i v e s 1 .   d e f   c o m p u t e _ e r r o r ( t a r g e t ,   p r e d i c t i o n s ) :
3 .   7 .       3   4 .             [ 4 4 ]     1 .   d e f   c o m p u t e _ e r r o r ( t a r g e t ,   p r e d i c t i o n s ) : 2 .           r e t u r n   m e t r i c s . a c c u r a c y _ s c o r e ( t a r g e t ,   p r e d i c t i o n s ) 4 .   d e f   c o m p u t e _ f a l s e _ n e g a t i v e s ( t a r g e t ,   p r e d i c t i o n s ) : 5 .           d f   =   p d . D a t a F r a m e ( { " t a r g e t " :   t a r g e t ,   " p r e d i c t i o n s " :   p r e d i c t i o n s } ) 6 .           r e t u r n   d f [ ( d f [ " t a r g e t " ]   = =   1 )   &   ( d f [ " p r e d i c t i o n s " ]   = =   0 ) ] . s h a p e [ 0 ]   /   ( d f [ ( d f [ " t a r g e t " ]   = =   1 ) ] . s h a p e [ 0 ]   +   1 ) 8 .   d e f   c o m p u t e _ f a l s e _ p o s i t i v e s ( t a r g e t ,   p r e d i c t i o n s ) : 9 .           d f   =   p d . D a t a F r a m e ( { " t a r g e t " :   t a r g e t ,   " p r e d i c t i o n s " :   p r e d i c t i o n s } ) 1 0 .           r e t u r n   d f [ ( d f [ " t a r g e t " ]   = =   0 )   &   ( d f [ " p r e d i c t i o n s " ]   = =   1 ) ] . s h a p e [ 0 ]   /   ( d f [ ( d f [ " t a r g e t " ]   = =   0 ) ] . s h a p e [ 0 ]   +   1 ) p r e d i c t . p y 1 .   d e f   r e a d ( ) : 2 .           t r a i n   =   p d . r e a d _ c s v ( o s . p a t h . j o i n ( s e t t i n g s . P R O C E S S E D _ D I R ,   " t r a i n . c s v " ) ) 3 .           r e t u r n   t r a i n 5 .   i f   _ _ n a m e _ _   = =   " _ _ m a i n _ _ " : 6 .           t r a i n   =   r e a d ( ) 7 .           p r e d i c t i o n s   =   c r o s s _ v a l i d a t e ( t r a i n ) 8 .           e r r o r   =   c o m p u t e _ e r r o r ( t r a i n [ s e t t i n g s . T A R G E T ] ,   p r e d i c t i o n s ) 9 .           f n   =   c o m p u t e _ f a l s e _ n e g a t i v e s ( t r a i n [ s e t t i n g s . T A R G E T ] ,   p r e d i c t i o n s ) 1 0 .           f p   =   c o m p u t e _ f a l s e _ p o s i t i v e s ( t r a i n [ s e t t i n g s . T A R G E T ] ,   p r e d i c t i o n s ) 1 1 .           p r i n t ( " A c c u r a c y   S c o r e :   { } " . f o r m a t ( e r r o r ) ) 1 2 .           p r i n t ( " F a l s e   N e g a t i v e s :   { } " . f o r m a t ( f n ) ) 1 3 .           p r i n t ( " F a l s e   P o s i t i v e s :   { } " . f o r m a t ( f p ) ) p y t h o n   p r e d i c t . p y . 2 6 2 6 % p r e d i c t . p y
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则