728x90
반응형

살콤아내 자기계발 247

파이썬 머신러닝 완벽가이드 2주차 정리 (사이킷런 131pg, 타이타닉 생존자 예측)

131pg. 사이킷런으로 수행하는 타이타닉 생존자 예측 - titanic 파일을 열어 대략적인 데이터 구조/타입을 본다. - Age, Cabin, Embarked 열의 null값을 fillna로 채워넣는다. - titanic_df.isnull( )은 bullean값의 DataFrame을 말한다. - 여기에 .sum( )을 적용하면 각 Column값의 True값의 합을 Series 타입으로 보여준다. - titanic_df.isnull( ).sum( )에 다시 .sum( )을 적용하면 각 series의 합이기 때문에 0이라는 int값 하나가 나온다. -value.coutns( ) 각 Column별로 unique한 값이 몇개가 있는지 count해줌 - 그런데 Cabin 값이 유난히 많다. 선실 타입이 중요하..

'Miracle' puppy born with six legs (11th March, 2021)

'Miracle' puppy born with six legs (11th March, 2021) Amid the constant stream of bad news that fills our screens, a heart-warming tale comes from a hospital in Oklahoma, USA. A puppy born with severe abnormalities has survived its first week, and doctors are optimistic that she will live a healthy life. Skipper the puppy is a cross-breed - she is a border collie and Australian shepherd mix. She..

파이썬 머신러닝 완벽가이드 2주차 정리 (데이터 전처리 118pg~, )

118pg. 데이터 전처리 (Data Preprocessing) - Null, NaN값(결손값)은 허용되지 않으므로 고정된 다른 값(평균값 등)으로 변환한다. Null값이 대부분이라면 해당 feature는 drop한다. - 사이킷런 ML알고리즘은 문자열을 입력값으로 허용하지 않으므로 숫자형으로 변환하거나 불필요한 경우 삭제한다. (feature vectorization) 데이터 인코딩 - Label encoding: 카테고리 feature를 코드형 숫자값으로 변환 (1, 2, 3...) - One Hot encoding: 고유 값에 해당하는 Column에만 1을 표시, 나머지는 0 Label Encoding encoder는 클래스 LabelEncoder( )의 인스턴스다. items안의 string 값의..

Denmark to make artificial clean-energy island (15th March, 2021)

Denmark to maked (15th March, 2021)Denmark to make artificial clean-energy island (15th March, 2021) Denmark has come up with a practical idea to help its clean energy needs. The Scandinavian nation intends to build an artificial island 80km off its western coast in the North Sea. It is expected to be in full operation by 2033. It hopes the ambitious project will end Denmark's reliance on fossil..

파이썬 머신러닝 완벽가이드 2주차 정리 (사이킷런 87pg~, )

ML방법에는 두 가지가 있다. - 지도학습(Supervised Learning): 정답값(결정값, target value, label value)을 가지고 있는 ML training 방법 - 비지도학습(Unsupervised Learning): 정답값이 없는 ML training 방법 - 사이킷런에서는 datasets 라는 연습용 예제데이터를 제공한다. 89pg. 지도학습 datasets 연습 결과값 iris.data와 iris.target을 호출하면 데이터는 다음과 같다. (하나의 줄 (row)가 하나의 붓꽃데이터를 말한다.) iris_label은 iris.data의 정답값(결정값)을 말한다. (붓꽃의 품종을 말함) column name을 한번 test해보자 iris_df = pd.DataFrame(d..

Online romance fraud is on the increase (19th March, 2021)

Online romance fraud is on the increase (19th March, 2021) Authorities are urging those looking for love on the Internet to be cautious. There was a 20 per cent spike in online romance fraud last year. The organisation UK Finance reported that cyber fraud increased considerably and coincided with a rise in the number of people looking for a partner online. This has been exacerbated by feelings o..

엄마표 영어교육을 위한 3권의 영어책 추천

아래 소개된 책들은 이중언어 또는 엄마표 영어를 꿈꾸는 부모들에게 매우 유익한 정보를 제공한다. 엄마표 영어를 하기 위해서는 아동언어발달에 관한 이론을 알고 있어야 하고, 엄마아빠가 실생활에서 간단한 영어를 사용할 수 있는 실력이 되어야 한다. (앵무새처럼 무의미하게 외워서 하는 영어대화가 아닌 아기과 소통하는 대화를 해야 하므로) 영어공부를 할 수 있는 채널은 무궁무진한데, 그 중 책을 통해 가장 효율적으로 기본단어를 익히고 기본적인 영어회화문장을 만들도록 하는 책 두권을 추천한다. 그리고 세 번째 책은 아동언어발달에 관한 책이다. 추천1. 원서 잡아먹는 영단어 자주 사용하는 영어단어 기본형의 유래부터 그 단어로부터 파생된 복잡한 단어까지 한 눈에 보기 좋게 나와있다. 엄마가 이 책을 읽고나면 영어단어..

Olympic Torch Relay starts in Japan (27th March, 2021)

Olympic Torch Relay starts in Japan (27th March, 2021) The torch relay for the Tokyo Olympics is finally under way. The 2020 Summer Games were postponed due to the coronavirus pandemic but organizers have been determined to ensure they go ahead in July. Members of the Japan women's football team ran as torchbearers in the first leg of the relay on Thursday. It began in Fukushima Prefecture, whic..

파이썬 머신러닝 완벽가이드 2주차 정리 (타이타닉실습 2_isnan, groupby)

타이타닉 연습문제1 : SibSp가 같은 나이의 평균으로 빈 Age값을 채우시오. Step 1) 타이타닉 데이터를 데이터 프레임 평태로 업로드 Step 2) null 값이 얼마나 있는지 확인 Step 3) Column별 데이터 분포 확인 Step 4) Pclass value_count 확인 Step 5) Age null값을 채우되 SiBsp가 같은 나이의 평균으로 채운다 (if, lambda 활용) 36줄~ if조건문: x[SibSp]의 각 값을 만족하는 조건에 대해 result=titanic_df [titanic_df ['SibSp'] == 0] ['Age'].mean( ) 결과값은 titanic_df(데이터프레임)에서 / titanic_df의 'SibSp'값이 0에 해당되는 불린값의 /'Age' Co..

파이썬 머신러닝 완벽가이드 1주차 정리 (판다스 60pg~, 타이타닉 실습)

61pg. 데이터 셀렉션 및 필터링 (.ix, .loc, iloc) DataFrame['칼럼명']과 같이 리스트 객체를 이용해서 원하는 데이터를 추출한다. Ex) titanic_df['Pcclss'].head(3) head(3)은 헤더정보를 3줄까지 추출한다는 의미 추가) titanic_df[0:2]과 같이 인덱스 슬라이싱을 이용해서 원하는 데이터를 추출할 수 있다. 추가) titanic_df[ titanic_df['Pclass']=3].head(3)과 같이 불린 인덱싱 표현으로 추출할 수 있다. 66pg. 명칭 기반(label) 인덱싱과 위치 기반(position) 인덱싱 참고) .ix는 더 이상 파이썬에서 제공되지 않는다 - 명칭기반 인덱싱: 칼럼의 명칭을 기반으로 위치지정 >> DataFrame의 ..

728x90
반응형