| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- MySQL
- programminglanguage
- 함수적용
- 너무힘들때
- 판다스
- 파이선
- 너무속상할때
- numpysort
- 점심뭐먹지
- Oracle
- dbeaber
- Python
- 파이선데이터타입
- 빅데이터
- 클라우드
- 넘파이
- mongoDB
- 힘든가
- 프로그래머
- 체했는가
- 프로그래밍
- 이길이맞는가
- Numpy
- java
- 개발자
- 자바
- pandas
- 나잘하고있는건가
- database
- AWS
- Today
- Total
목록전체 글 (45)
ddavely
해외 취업 준비 아이캐치유 전화영어 화상영어 실리콘밸리에 도전하기로 마음 먹고 시작된 영어 스피킹 ! 1년차 프로그래머가 된 지금 현업에서 백엔드와 프론트를 번갈아가며 작업했고 나의 2022년을 정말 온 힘을 다해 일에 열중했다. 마치 회고록 같기도 . 인생을 살며 가장 열심히 배우고 달리고 희열을 느낀 해였기도 . 그렇게 나는 꿈이 확장 되었고 이 정도의 열정으로 더 넓은 곳에서 놀고 싶었고 . 더 다양한 경험을 해야겠단 확신이 생겼다 . 그래서 ! 난 지난 2022년 보다도 앞으로의 2023년을 더 나아가야한다 ! 난 확인하고 싶다 내가 얼마나 클 수 있는지 내 역량이 얼마나 될지 과연 그 끝은 어디 일지 그래서 주저없이 바로 시작했다 ! 그래 ! 하는거야 ! practice ! spe..
5) 정규화(Normalization) 데이터의 범위를 0과 1사이로 변환해서 조정하는 방법 여러 개의 열을 가지고 있는 데이터에서 주로 이용 표준화는 열 단위로 scailing을 수행하지만 정규화는 여러 개의 열을 한꺼번에 scailing 함 거리 계산 >> 유클리드 거리 : 점과 점 사이의 거리를 대각선으로 계산 / 맨하튼 거리 : 가로 방향 + 세로 방향으로 계산 / 마할라노비스 거리 : 평균과의 거리가 표준편차의 몇 배인지를 계산 scikit-learn의 preprocessing 패키지의 Nomalizer 클래스를 이용 >> 객체를 생성할 때 norm 옵션에 l1이라고 대입하면 맨하튼 거리로 계산하고 l2를 대입하면 유클리드 거리를 이용해서 계산하고 max를 대입하면 가장 큰 값으로 나눔 Scal..
Python :: Data Preprocessing 데이터 전처리 데이터를 용도에 맞게 가공하는 것 1. 수치형 데이터의 전처리 1) 단위 환산 어떤 데이터의 비교해야하는 컬럼들의 단위가 서로 다르거나 이해하기 어려운 단위라면 단위 환산을 수행해서 이해할 수 있는 데이터로 변경해주는 것이 좋음 #수치 데이터 #단위 환산 #데이터 읽어오기 # 라이브러리 불러오기 import pandas as pd # 데이터 읽어오기 df = pd.read_csv('./data/auto-mpg.csv', header=None) # 열 이름을 설정 df.columns = ['mpg','cylinders','displacement','horsepower','weight', 'acceleration','model year','o..
Python :: Cartogram 카토그램 데이터 값에 따라서 지도의 면적이 왜곡되는 그림 변량 비례도 또는 왜상 통계 지도라고 부르기도 함 인구소멸지역 cartogram 1. 데이터 가져오기 국가 통계 포털에서 인구 정보 내려받기 http://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1IN1509 KOSIS kosis.kr import matplotlib import pandas as pd import numpy as np import platform import matplotlib.pyplot as plt matplotlib inline path = "c:/Windows/Fonts/malgun.ttf" from matplotlib import font_..
5. 그룹 연산 데이터를 어떤 기준에 따라 그룹으로 나누어서 집계나 변환이나 필터링을 수행 groupby함수를 이용하는데 열 이름이나 열 이름의 list를 이용해서 그룹화 #그룹화 import numpy as np import pandas as pd import seaborn as sns titanic = sns.load_dataset('titanic') titanic.info() df = titanic.loc[:, ['age','sex', 'class', 'fare', 'survived']] print('승객 수:', len(df)) print(df.head()) print() # class 열을 기준으로 분할 grouped = df.groupby(['class']) print(grouped) prin..
진짜.....자료..정리한거 날아갈때마다 너무 속상하다.....................ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ으어엉 Python :: Pandas의 활용 **Pycharm 에서의 프로젝트 생성 자신의 컴퓨터에 설치된 파이썬의 위치를 알아야 함 - anaconda 의 경우 windows 는 기본적으로 c:\programdata\anaconda3 mac은 opt/anaconda3 1.중복 데이터 처리 하나의 데이터 셋에서 동일한 데이터가 2개 이상 존재하면 분석 결과를 왜곡할 수 있음 중복된 데이터를 찾는 것은 중요한 작업 중의 하나 1)duplicated() 데이터의 중복 여부를 bool 의 Series 객체로 리턴 2)drop_duplicates() 아무런 옵션이 없다면 모든 열의 값이 동일한 데이터..
DevOps에서 시작된 머신러닝 MLOps는 엔터프라이즈 애플리케이션을 효율적으로 개발, 배포, 실행하는 프로세스나 기술인 DevOps를 기반으로 한 기술. 10년 전 갈등관계에 있던 소프트웨어 개발자(Devs)와 IT 운영 팀(Ops)의 협업 방안으로 고안된 것이 DevOps의 시작. MLOps는 데이터세트를 준비하고 이를 분석하는 AI 모델을 만드는 데이터 사이언티스트 팀을 지원. 이 팀에는 데이터세트를 모델을 통해 체계적으로 자동 처리하는 머신러닝 엔지니어도 포함 [출처] AI 개발의 스포트라이트 ‘MLOps’ A to Z 알아보기 1|작성자 NVIDIA 엘리트 파트너 참조 : AI 개발의 스포트라이트 ‘MLOps’ A t.. : 네이버블로그 (naver.com) AI 개발의 스포트라이트 ‘MLOp..
5) plotnine R의 ggplot2에 기반해 그래프를 그려주는 라이브러리 설치가 되어 있지 않아서 설치한 후에 사용 https://plotnine.readthedocs.io/en/stable/ 에서 api 지원 A Grammar of Graphics for Python — plotnine 0.8.0 documentation A Grammar of Graphics for Python plotnine is an implementation of a grammar of graphics in Python, it is based on ggplot2. The grammar allows users to compose plots by explicitly mapping data to the visual objects..
Python :: DataExploratory 데이터 탐색 1. 통계 함수 1) 기본 통계 함수 count, min, max, sum, mean(평균), median(중간값), mode(최빈값) >> 데이터 분석시험에서 필. 수. var(분산), std(표준 편차), 2) 데이터의 분포 확인을 위한 함수 kurt ( 첨도 - kurtosis) >> 데이터 분석시험에서 필. 수. skew ( 왜도 - skewness) >> 데이터 분석시험에서 필. 수. sem ( 평균의 표준 오차) quantile( 4분위수 - 1/4, 2/4, 3/4) 3) 요약 describe() 4) 누적 cumsum cummin cummax cumprod 5) 차이 diff(산술차이) pct_change(백분율) 6) 유일한 데이..
Python :: Data Exploratory 데이터 탐색 1. DataFrame에서의 데이터 선택 1)열 선택 DataFrame객체.열이름 또는 DataFrame객체.['열이름'] 하나의 열을 선택하면 Series 객체로 리턴됨 여러개의 열을 선택하고자 할때는 열 이름 대신에 list로 열 이름들을 묶어서 전달하면 됨 >> 이 경우에는 DataFrame으로 리턴 DataFrame객체.[[열이름 나열]] #열 단위로 데이터 추출하기 from pandas import Series, DataFrame import pandas as pd #데이터 가져오기 df = pd.read_csv('./data/item.csv') #인덱스 설정 df.index=['사과', '수박', '참외', '바나나', '레몬', '..