본문 바로가기

Theory53

인공지능 기초 개념 머신러닝 데이터를 사용해서 기계가 스스로 학습하는 방식 지도 학습, 비지도 학습, 강화 학습으로 구분 딥러닝 머신러닝의 기법 중 하나 지도 학습 정답이 있는 데이터를 이용하여 인공지능이 스스로 학습 분류에 사용 (이진 분류, 다중 분류) 회귀(연속적인 값을 예측)에 사용 데이터의 정답(레이블)이 있는 경우 사용 비지도 학습 지도 학습이 아닌 학습 정답이 없는 데이터를 이용하여 인공지능이 스스로 학습 정답이 없는 데이터에서 그 데이터의 특징을 찾아서 스스로 구분 지도 학습을 보완해주는 역할 군집화, 차원 축소에서 사용 군집화 데이터를 여러 그룹으로 묶는 것 추천 시스템, 알고리즘 등에 사용 차원 축소 데이터의 여러 특징들을 살펴보고 가장 대표적인 특징만 뽑아내는 것 차원은 데이터의 특징을 의미 강화 학습 .. 2023. 12. 23.
[Python 데이터 분석] 01 데이터 불러오기 CSV ‘Comma-Separated Values’의 약자로 각각의 데이터 값을 콤마(,)로 구분하는 파일 형식 정부에서 운영하는 공공데이터포털(www.data.go.kr)이 제공하는 일반적인 파일 형식 CSV 파일에서 데이터 읽어오기 csv.reader() 함수 : CSV 파일에서 데이터를 읽어오는 함수 csv.writer() 함수 : CSV 파일에서 데이터를 저장하는 함수 import csv # csv 모듈 불러오기 f = open('seoul.csv', encoding='cp949') # csv 파일을 open() 함수로 열어서 f에 저장 data = csv.reader(f) # f를 reader() 함수에 넣어 data라는 csv reader 객체 생성 for row in data : print(.. 2023. 11. 2.
[통계 분석] 06 유의성 검정 / 통계 분석 프로세스 유의 확률 p로 표기 귀무가설을 지지하는 힘 p-value는 귀무가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 같거나 더 극단적 통계치가 관측될 확률 관찰된 데이터가 귀무가설과 양립하는 정도를 0~1사이의 수치로 표현한 것 p-value가 적을수록 그 정도가 약하다고 보며, 특정값(대개 0.05 또는 0.01)보다 작을 경우 귀무가설을 기각 대립가설을 지지하는 검정통계치를 모을 확률로 귀무가설을 지지하는 정도로 해석 유의 수준 α로 표기 통계적 가설검정에서 귀무가설의 기각 여부를 결정하는데 사용되는 기준이 되는 확률 95% 신뢰도를 기준으로 한다면 0.05가 유의수준 값 1종 오류를 범할 확률의 허용한계로 유의 수준과 유의 확률을 비교해서 귀무가설의 기각 여부를 결정 표본을 토대로 내린 결론.. 2023. 9. 30.
[통계 분석] 05 확률 분포 / 표본으로 모집단 추정 / 인과 관계와 상관 관계 확률 분포 확률 분포란 모집단을 수학적으로 표현한 것 특정 확률 변수가 일어날 확률에 대한 정보 제공 특정 확률 변수의 확룰 분포를 알고 있다면 특정 사건이 일어날 확률을 계산(예측)할 수 있기 때문에 유용 확률 법칙 한 사건의 확률은 0과 1사이의 수이다. 여사건 법칙 : 어떤 사건이 일어날 확률은 '1 - 그 사건이 일어나지 않을 확률'이다. 덧셈 법칙 : 배반 사건들의 전체 확률은 각 확률을 더해서 구한다. 곱셈 법칙 : 일련의 독립 사건들이 일어날 전체 확률은 각 확률을 곱해서 구한다. 데이터의 부트스트랩 (Bootstrap) 복원 추출을 반복해 추정값의 변동성에 관한 아이디어를 얻는 과정 부트스트랩 분포를 이용해 추정값들의 불확실성 수치화 가능 강력한 가정 없이 확률 이론을 이용하지 않고서 추정.. 2023. 9. 30.