๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
728x90

ํŒŒ์ด์ฌ4

[์‹ค๊ธฐ] ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ์‚ฌ ์ž‘์—…ํ˜• 3 ์ •๋ฆฌ (Python) ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ์‚ฌ ์‹ค๊ธฐ -  ์ž‘์—…ํ˜• 3 ์ •๋ฆฌ๋ณธ๐Ÿšจ ๋ชจ๋“  ์ฝ”๋“œ๋Š” ํŒŒ์ด์ฌ ๊ธฐ์ค€์ž…๋‹ˆ๋‹ค.๋”๋ณด๊ธฐ์ž‘์—…ํ˜• 3์— ๋Œ€ํ•œ ์ •๋ณด๋Š” ์ •๋ง ์ ๊ณ  7ํšŒ ์‹ค๊ธฐ ์‹œํ—˜์„ ๋ณด๊ณ  ์ •๋ฆฌ๊ธ€์„ ์ž‘์„ฑํ•˜์ง€๋งŒ ์•„์ง๊นŒ์ง€ ์ž˜ ๋ชจ๋ฅด๊ฒ ๋‹ค.์šฐ์„  ์ •๋ง ๊ธฐ๋ณธ์ ์œผ๋กœ ์•„๋ž˜์˜ ๋ฌธ์ œ๋ฅผ ๋ชจ๋‘ ์ตํžˆ๊ณ  ์•ฝ๊ฐ„์˜ ์‘์šฉ์ด ๊ฐ€๋Šฅํ•˜๋‹ค๋ฉด ๋ถ€๋ถ„ ์ ์ˆ˜๋ฅผ ๋ณด๋ ค๋ณผ ์ˆœ ์žˆ์„ ๊ฒƒ ๊ฐ™๋‹ค. 1. T๊ฒ€์ •1) ์Œ์ฒดํ‘œ๋ณธfrom scipy import statss , p = stats.ttest_rel(data['bp_post'], data['bp_pre'], alternative="less")if (p > 0.05): result4 = 't'else: result4 = 'f'# ์—ฌ๊ธฐ์„œ result4๊ฐ€ f๋กœ ๋‚˜์™”์œผ๋ฏ€๋กœ p๊ฐ’์ด ์œ ์˜์ˆ˜์ค€๋ณด๋‹ค ๋‚ฎ์Œ์„ ์˜๋ฏธ# ์ฆ‰ ์‹คํ—˜์— ์„ฑ๊ณตํ•˜์˜€์œผ๋‹ˆ ๋Œ€๋ฆฝ๊ฐ€์„ค์ด ์ฑ„ํƒ๋˜.. 2023. 12. 4.
[์‹ค๊ธฐ] ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ์‚ฌ ์ž‘์—…ํ˜• 2 ์ •๋ฆฌ (Python) ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ์‚ฌ ์‹ค๊ธฐ - ์ž‘์—…ํ˜• 2 ์ •๋ฆฌ๋ณธ ๐Ÿšจ ๋ชจ๋“  ์ฝ”๋“œ๋Š” ํŒŒ์ด์ฌ ๊ธฐ์ค€์ž…๋‹ˆ๋‹ค. ๐Ÿ‘€ ์ž‘์—…ํ˜• 2 ๋ฌธ์ œ ํ’€์ด ์ˆœ์„œ 1 ๋‹จ๊ณ„ : ๋ฐ์ดํ„ฐ ํŒŒ์•…ํ•˜๊ธฐ, ๋ฐ์ดํ„ฐ ํ•™์Šต ๋ชจ๋ธ ์„ ์ •(๋ถ„๋ฅ˜, ํšŒ๊ท€) 2 ๋‹จ๊ณ„ : ๋ฐ์ดํ„ฐ ์ •๋ฆฌ : ๋ถˆํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ, ๊ฒฐ์ธก์น˜, ๋ฌธ์žํ˜• ๋“ฑ ์ „์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•œ ์ปฌ๋Ÿผ ์ฒดํฌํ•˜๊ธฐ 3 ๋‹จ๊ณ„ : ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌํ•˜๊ธฐ 4 ๋‹จ๊ณ„ : ๋ฐ์ดํ„ฐ ๋ถ„๋ฆฌํ•˜๊ธฐ, ๋ชจ๋ธ ํ•™์Šต ์ „ ์ตœ์ ์˜ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฆฌํ•˜์—ฌ ํ…Œ์ŠคํŠธ - ๋งŒ์•ฝ xtrain, xtest, ytrain์˜ ํ˜•ํƒœ๊ฐ€ ์•„๋‹Œ train, test๋งŒ ์ฃผ์–ด์ง„๋‹ค๋ฉด ํ•„์ˆ˜๋กœ ๋ฐ์ดํ„ฐ ๋ถ„๋ฆฌํ•ด์•ผํ•จ 5 ๋‹จ๊ณ„ : ๋ฐ์ดํ„ฐ ํ•™์Šต : ๋ฌธ์ œ์— ๋งž๋Š” ๋ฐ์ดํ„ฐ ๋ชจ๋ธ ์„ ํƒํ•˜์—ฌ ํ•™์Šต์‹œํ‚ค๊ธฐ 6 ๋‹จ๊ณ„ : ์ œ์ถœํ•˜๊ธฐ ์ „ ๋ฐ์ดํ„ฐ ํ™•์ธํ•˜๊ณ  ์ œ์ถœํ•˜๊ธฐ โœ๏ธ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ 1 ) ๋ถˆํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ ์‚ญ์ œ drop.. 2023. 12. 3.
[์‹ค๊ธฐ] ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ์‚ฌ ์ž‘์—…ํ˜• 1 ์ •๋ฆฌ (Python) ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ธฐ์‚ฌ ์‹ค๊ธฐ - ์ž‘์—…ํ˜• 1 ์ •๋ฆฌ๋ณธ ๐Ÿšจ ๋ชจ๋“  ์ฝ”๋“œ๋Š” ํŒŒ์ด์ฌ ๊ธฐ์ค€์ž…๋‹ˆ๋‹ค. 1. ํ•จ์ˆ˜ ์‚ฌ์šฉ def df_events(x): if (x['Events'] == 1): return x['Sales'] * 0.8 else: return x['Sales'] df['RSales'] = df.apply(df_events, axis=1) 2. Merge์™€ dropna ์‚ฌ์šฉ๋ฒ• โญ๏ธ ( 7ํšŒ ์ž‘์—…ํ˜• 1 dropna ์ œ์ถœ ) # basic1 ๋ฐ์ดํ„ฐ์™€ basic3 ๋ฐ์ดํ„ฐ๋ฅผ 'f4'๊ฐ’์„ ๊ธฐ์ค€์œผ๋กœ ๋ณ‘ํ•ฉํ•˜๊ธฐ df = b1.merge(b3, how='inner', on='f4') # ๋ณ‘ํ•ฉํ•œ ๋ฐ์ดํ„ฐ์—์„œ r2๊ฒฐ์ธก์น˜๋ฅผ ์ œ๊ฑฐํ•˜๊ธฐ df = df.dropna(subset=['r2']) 3. ์ •๋ ฌ # ์˜ค๋ฆ„์ฐจ์ˆœ : 1, 2, 3, 4 d.. 2023. 12. 1.
๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ ์‹ค๊ธฐ ์ž„์‹œ ์ •๋ฆฌ๋ณธ ๐Ÿ“ ์‹ค๊ธฐ ์ค€๋น„ ์ฐธ๊ณ  ์ž๋ฃŒ : ํŒ๋‹ค์Šค ๊ธฐ์ดˆ : https://wikidocs.net/book/4639 ๋น…๋ฐ์ดํ„ฐ๋ถ„์„๊ธฐ์‚ฌ ์‹ค๊ธฐ ์ฒดํ—˜ํ™˜๊ฒฝ : https://dataq.goorm.io/exam/3/์ฒดํ—˜ํ•˜๊ธฐ/quiz/1 Big Data Certification KR : https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr ํ‡ด๊ทผํ›„๋”ด์ง“ : https://www.youtube.com/watch?v=iOskHbBeV9o&list=PLSlDi2AkDv82Qv7B3WiWypQSFmOCb-G_- ๊ฐ•๋‹ค๋ฆฐ DARIN : https://www.youtube.com/watch?v=iopLP4wBYw8 ๐Ÿ“ ์ž‘์—…ํ˜• 2 1๋‹จ๊ณ„ : ๋ฐ์ดํ„ฐ ํŒŒ์•…ํ•˜๊ธฐ, ๋ฐ์ดํ„ฐ ํ•™์Šต ๋ชจ๋ธ ์„ ์ •(๋ถ„๋ฅ˜,.. 2023. 11. 29.
728x90