Python 34

User Segmentation - retail data - 1(전처리)

select * from retail_data rd import numpy as np import pandas as pd import plotly.express as px #데이터 시각화 import seaborn as sns import matplotlib.pyplot as plt import plotly.graph_objects as go from wordcloud import WordCloud from mpl_toolkits.mplot3d import Axes3D import re #텍스트 데이터 정제 -> 토큰화, 단어 형태소 분석 import nltk from nltk.corpus import stopwords from nltk.tokenize import word_tokenize from nl..

Python 2024.03.23

Numpy Summary

1. 넘파이는 파이썬 머신러닝을 구성하는 핵심 기반으로 반드시 이해가 필요. 2. 넘파이 API는 매우 넓은 범위를 다루고 있으므로 머신러닝 애플리케이션을 작성할 때 중요하게 활용될 수 있는 핵심 개념 위주로 숙지하는 것이 좋음. 3. 넘파이는 판다스에 비해서 친절한 API를 제공하지 않음. 2차원의 데이터라면 데이터 가공을 위해서 넘파이 보다는 판다스를 이용하는 것이 보다 효율적.

Python 2024.03.19

넘파이 ndarray의 데이터 세트 선택하기 - indexing

단일 인덱싱 # 1에서 부터 9 까지의 1차원 ndarray 생성 array1 = np.arange(start=1, stop=10) print('array1:',array1) # index는 0 부터 시작하므로 array1[2]는 3번째 index 위치의 데이터 값을 의미 value = array1[2] # 위치 인덱스2에 해당하는 값 반환 print('value:',value) print(type(value)) array1: [1 2 3 4 5 6 7 8 9] value: 3 맨 뒤의 값/맨뒤에서 n번째 값 print('맨 뒤의 값:',array1[-1], ', 맨 뒤에서 두번째 값:',array1[-2]) 맨 뒤의 값: 9 , 맨 뒤에서 두번째 값: 8 위치 인덱스를 통해서 값 바꾸기 array1[0..

Python 2024.03.19

Numpy 개요

ndarray 의 데이터 타입 list1 = [1,2,3] print(type(list1)) array1 = np.array(list1) print(type(array1)) print(array1, array1.dtype) #원소들의 속성을 활용하고 싶으면 Dtype 활용 [1 2 3] int32 ndarray를 편리하게 생성하기 - arange, zeros, ones 1. np.arage sequence_array = np.arange(10) # 10개의 원소를 가지는 원디멘션 print(sequence_array) print(sequence_array.dtype, sequence_array.shape) shape를 가지는 10개의 요소를 가지고 있다 2. np.zeros #(3, 2) shape을 가..

Python 2024.03.18