Notice
Recent Posts
Recent Comments
Link
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

HJunS

[혼공족] 혼자 공부하는 머신러닝 + 딥러닝 1주차 Ch01 본문

혼공단

[혼공족] 혼자 공부하는 머신러닝 + 딥러닝 1주차 Ch01

HJunS 2024. 1. 4. 18:01

Ch01 나의 첫 머신러닝

01-1 인공지능과 머신러닝, 딥러닝

  • 인공지능: 사람처럼 학습하고 추론하는 시스템
  • 머신러닝: 자동으로 규칙을 학습하는 알고리즘을 연구하는 분야
    대표 라이브러리: 사이킷런
  • 딥러닝: 인공 신경망
    대표라이브러리: 텐서플로우, 파이토치

01-2 코랩과 주피터 노트북

마크다운 형식 설명
# 제목 # 1~5개 제목 글자 크기 결정
**혼공머신** 혼공머신 굵은 글씨
*혼공머신*
_혼공머신_
혼공머신 기울임 꼴
~~혼공머신~~ 혼공머신 취소선
`print()` 백틱 기호로 코드 서체
> 혼공머신 들여쓰기
* 혼공머신
- 혼공머신
글머리 기호
[한빛미디어](www.hanbit.co.kr) 링크 만들기
![한빛미디어](www.hanbit.co.kr/image) 이미지 추가
$ y = 2x $ 레이텍 추가

 

01-3 마켓과 머신러닝

k-최근접 이웃으로 이진 분류 머신러닝 모델 훈련

  • 도미와 빙어 데이터를 matplotlib으로 산점도(scatter plot)를 파악했다.

  • 훈련에 사용할 데이터 셋을 만든다.

 

 

  • k-최근접 알고리즘: 주위 데이터 거리를 계산하고 가장 가까운 데이터들로 다수결의 원칙에 따라 예측한다.
    n_neighbors 매개변수로 참조 데이터 개수를 변경할 수 있다.
  • 이진분류: 2개의 클래스 중 하나를 고르는 문제

 

[30, 600]을 예측했을 때 [1] 도미로 예측한다.

 

_fit_X에 fish_data, _y에 fish_target을 가지고있다.

 

  • n_neighbors 매개변수로 참고할 가장 가까운 데이터의 개수를 정한다. (49개의 데이터를 참조)
    • 도미가 35 마리 빙어가 14마리이기 때문에 다수결로 49의 모든 데이터를 도미로 예측한다.
    • 35/49 = 0.714
  • score로 확인할 수 있다. 
kn49 = KNeighborsClassifier(n_neighbors=49)
kn49.fit(fish_data, fish_target)
# score = 35/49  = 0.7142857142857143
kn49.score(fish_data, fish_target)