본문 바로가기

분류 전체보기195

인공지능 기초 개념 머신러닝 데이터를 사용해서 기계가 스스로 학습하는 방식 지도 학습, 비지도 학습, 강화 학습으로 구분 딥러닝 머신러닝의 기법 중 하나 지도 학습 정답이 있는 데이터를 이용하여 인공지능이 스스로 학습 분류에 사용 (이진 분류, 다중 분류) 회귀(연속적인 값을 예측)에 사용 데이터의 정답(레이블)이 있는 경우 사용 비지도 학습 지도 학습이 아닌 학습 정답이 없는 데이터를 이용하여 인공지능이 스스로 학습 정답이 없는 데이터에서 그 데이터의 특징을 찾아서 스스로 구분 지도 학습을 보완해주는 역할 군집화, 차원 축소에서 사용 군집화 데이터를 여러 그룹으로 묶는 것 추천 시스템, 알고리즘 등에 사용 차원 축소 데이터의 여러 특징들을 살펴보고 가장 대표적인 특징만 뽑아내는 것 차원은 데이터의 특징을 의미 강화 학습 .. 2023. 12. 23.
[Python 데이터 분석] 01 데이터 불러오기 CSV ‘Comma-Separated Values’의 약자로 각각의 데이터 값을 콤마(,)로 구분하는 파일 형식 정부에서 운영하는 공공데이터포털(www.data.go.kr)이 제공하는 일반적인 파일 형식 CSV 파일에서 데이터 읽어오기 csv.reader() 함수 : CSV 파일에서 데이터를 읽어오는 함수 csv.writer() 함수 : CSV 파일에서 데이터를 저장하는 함수 import csv # csv 모듈 불러오기 f = open('seoul.csv', encoding='cp949') # csv 파일을 open() 함수로 열어서 f에 저장 data = csv.reader(f) # f를 reader() 함수에 넣어 data라는 csv reader 객체 생성 for row in data : print(.. 2023. 11. 2.
02 자주 활용하는 라이브러리 함수 upper() 지정된 문자열의 모든 글자를 대문자로 변경 lower() 지정된 문자열의 모든 글자를 소문자로 변경 strip() 지정된 문자열의 공백 삭제, 문장 안의 공백은 삭제 X join() 지정된 단어를 이용해 잘려있는 문자열을 붙여 씀. split() 빈칸 기준으로 문자열 분리, 특정 단어를 기준으로 삼고 싶다면 괄호 안에 단어 작성 replace() 특정 단어를 특정 단어로 변경, 빈칸을 모두 지우고 싶을 때는 replace 함수 사용 format() 특정 문장의 원하는 위치에 원하는 데이터를 넣고 싶을 때 사용, 데이터를 넣고 싶은 자리에 대괄호{} 삽입, 괄호에 원하는 글자 작성 isdigit() 데이터가 숫자인지 확인 isalnum() 데이터가 숫자인지 알파벳인지 확인 append() 특.. 2023. 10. 10.
[통계 분석] 06 유의성 검정 / 통계 분석 프로세스 유의 확률 p로 표기 귀무가설을 지지하는 힘 p-value는 귀무가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 같거나 더 극단적 통계치가 관측될 확률 관찰된 데이터가 귀무가설과 양립하는 정도를 0~1사이의 수치로 표현한 것 p-value가 적을수록 그 정도가 약하다고 보며, 특정값(대개 0.05 또는 0.01)보다 작을 경우 귀무가설을 기각 대립가설을 지지하는 검정통계치를 모을 확률로 귀무가설을 지지하는 정도로 해석 유의 수준 α로 표기 통계적 가설검정에서 귀무가설의 기각 여부를 결정하는데 사용되는 기준이 되는 확률 95% 신뢰도를 기준으로 한다면 0.05가 유의수준 값 1종 오류를 범할 확률의 허용한계로 유의 수준과 유의 확률을 비교해서 귀무가설의 기각 여부를 결정 표본을 토대로 내린 결론.. 2023. 9. 30.