728x90
반응형

살콤아내 자기계발 236

'Miracle' puppy born with six legs (11th March, 2021)

'Miracle' puppy born with six legs (11th March, 2021) Amid the constant stream of bad news that fills our screens, a heart-warming tale comes from a hospital in Oklahoma, USA. A puppy born with severe abnormalities has survived its first week, and doctors are optimistic that she will live a healthy life. Skipper the puppy is a cross-breed - she is a border collie and Australian shepherd mix. She..

파이썬 머신러닝 완벽가이드 2주차 정리 (데이터 전처리 118pg~, )

118pg. 데이터 전처리 (Data Preprocessing) - Null, NaN값(결손값)은 허용되지 않으므로 고정된 다른 값(평균값 등)으로 변환한다. Null값이 대부분이라면 해당 feature는 drop한다. - 사이킷런 ML알고리즘은 문자열을 입력값으로 허용하지 않으므로 숫자형으로 변환하거나 불필요한 경우 삭제한다. (feature vectorization) 데이터 인코딩 - Label encoding: 카테고리 feature를 코드형 숫자값으로 변환 (1, 2, 3...) - One Hot encoding: 고유 값에 해당하는 Column에만 1을 표시, 나머지는 0 Label Encoding encoder는 클래스 LabelEncoder( )의 인스턴스다. items안의 string 값의..

Denmark to make artificial clean-energy island (15th March, 2021)

Denmark to maked (15th March, 2021)Denmark to make artificial clean-energy island (15th March, 2021) Denmark has come up with a practical idea to help its clean energy needs. The Scandinavian nation intends to build an artificial island 80km off its western coast in the North Sea. It is expected to be in full operation by 2033. It hopes the ambitious project will end Denmark's reliance on fossil..

파이썬 머신러닝 완벽가이드 2주차 정리 (사이킷런 87pg~, )

ML방법에는 두 가지가 있다. - 지도학습(Supervised Learning): 정답값(결정값, target value, label value)을 가지고 있는 ML training 방법 - 비지도학습(Unsupervised Learning): 정답값이 없는 ML training 방법 - 사이킷런에서는 datasets 라는 연습용 예제데이터를 제공한다. 89pg. 지도학습 datasets 연습 결과값 iris.data와 iris.target을 호출하면 데이터는 다음과 같다. (하나의 줄 (row)가 하나의 붓꽃데이터를 말한다.) iris_label은 iris.data의 정답값(결정값)을 말한다. (붓꽃의 품종을 말함) column name을 한번 test해보자 iris_df = pd.DataFrame(d..

Online romance fraud is on the increase (19th March, 2021)

Online romance fraud is on the increase (19th March, 2021) Authorities are urging those looking for love on the Internet to be cautious. There was a 20 per cent spike in online romance fraud last year. The organisation UK Finance reported that cyber fraud increased considerably and coincided with a rise in the number of people looking for a partner online. This has been exacerbated by feelings o..

엄마표 영어교육을 위한 3권의 영어책 추천

아래 소개된 책들은 이중언어 또는 엄마표 영어를 꿈꾸는 부모들에게 매우 유익한 정보를 제공한다. 엄마표 영어를 하기 위해서는 아동언어발달에 관한 이론을 알고 있어야 하고, 엄마아빠가 실생활에서 간단한 영어를 사용할 수 있는 실력이 되어야 한다. (앵무새처럼 무의미하게 외워서 하는 영어대화가 아닌 아기과 소통하는 대화를 해야 하므로) 영어공부를 할 수 있는 채널은 무궁무진한데, 그 중 책을 통해 가장 효율적으로 기본단어를 익히고 기본적인 영어회화문장을 만들도록 하는 책 두권을 추천한다. 그리고 세 번째 책은 아동언어발달에 관한 책이다. 추천1. 원서 잡아먹는 영단어 자주 사용하는 영어단어 기본형의 유래부터 그 단어로부터 파생된 복잡한 단어까지 한 눈에 보기 좋게 나와있다. 엄마가 이 책을 읽고나면 영어단어..

Olympic Torch Relay starts in Japan (27th March, 2021)

Olympic Torch Relay starts in Japan (27th March, 2021) The torch relay for the Tokyo Olympics is finally under way. The 2020 Summer Games were postponed due to the coronavirus pandemic but organizers have been determined to ensure they go ahead in July. Members of the Japan women's football team ran as torchbearers in the first leg of the relay on Thursday. It began in Fukushima Prefecture, whic..

파이썬 머신러닝 완벽가이드 2주차 정리 (타이타닉실습 2_isnan, groupby)

타이타닉 연습문제1 : SibSp가 같은 나이의 평균으로 빈 Age값을 채우시오. Step 1) 타이타닉 데이터를 데이터 프레임 평태로 업로드 Step 2) null 값이 얼마나 있는지 확인 Step 3) Column별 데이터 분포 확인 Step 4) Pclass value_count 확인 Step 5) Age null값을 채우되 SiBsp가 같은 나이의 평균으로 채운다 (if, lambda 활용) 36줄~ if조건문: x[SibSp]의 각 값을 만족하는 조건에 대해 result=titanic_df [titanic_df ['SibSp'] == 0] ['Age'].mean( ) 결과값은 titanic_df(데이터프레임)에서 / titanic_df의 'SibSp'값이 0에 해당되는 불린값의 /'Age' Co..

파이썬 머신러닝 완벽가이드 1주차 정리 (판다스 60pg~, 타이타닉 실습)

61pg. 데이터 셀렉션 및 필터링 (.ix, .loc, iloc) DataFrame['칼럼명']과 같이 리스트 객체를 이용해서 원하는 데이터를 추출한다. Ex) titanic_df['Pcclss'].head(3) head(3)은 헤더정보를 3줄까지 추출한다는 의미 추가) titanic_df[0:2]과 같이 인덱스 슬라이싱을 이용해서 원하는 데이터를 추출할 수 있다. 추가) titanic_df[ titanic_df['Pclass']=3].head(3)과 같이 불린 인덱싱 표현으로 추출할 수 있다. 66pg. 명칭 기반(label) 인덱싱과 위치 기반(position) 인덱싱 참고) .ix는 더 이상 파이썬에서 제공되지 않는다 - 명칭기반 인덱싱: 칼럼의 명칭을 기반으로 위치지정 >> DataFrame의 ..

파이썬 머신러닝 완벽가이드 1주차 정리 (판다스 39pg~), 타이타닉 실습

39pg 판다스(Pandas) - 넘파이 기반으로 작성되었고 넘파이보다 고수준 API를 제공한다. 칼럼을 분리한 파일, CSV파일 등을 DataFrame타입으로 변경해 사용가능하다. * API: application programming interface - 판다스는 주로 행과 열로 이루어진 2차원 데이터 DataFrame을 핵심개체로 한다. (Series 데이터타입도 제공함) - Series와 DataFrame은 모두 Index를 key값으로 가지고 있다. - Series는 칼럼이 하나인 데이터구조이지만 (1차원데이터) DataFrame은 칼럼이 여러개로 이루어진다. (즉 DataFrame은 여러개의 Series로 이루어졌다고 말할 수 있다.=2차원 데이터) 1. Titanic 실습 아래 홈페이지에서 ..

728x90
반응형