6600| 31
|
十周成為數(shù)據(jù)分析師教程 |
十周成為數(shù)據(jù)分析師教程
邏輯思維 日積月累有意識的鍛煉形成的一套解決問題的邏輯能力 歸納與演繹|分析與綜合| 抽象與概括| 比較思維法| 因果思維|遞推思維|逆向思維...... 業(yè)務分析 面對不同的場景,應用不同分析模型解決問題 5W2H分析模型| AARRR分析模型| RFM客戶價值模型| A/B測試模型|用戶分成模型| SWOT分析模型| 購物籃分析模型| 波士頓矩陣分析|生命周期模型|企業(yè)戰(zhàn)略模型. 工具、工程能力 利用技能更方便高效的解決問題 EXCEL| SQL| Python| Pandas| NumPy| Matplotlib| PyEcharts| PowerBI| Tablea..... 課程目錄: 第一周 Part1、數(shù)據(jù)分析導論 ●數(shù)據(jù)是什么?數(shù)據(jù)能做什么? ●數(shù)據(jù)的變異性、規(guī)律性和客觀性 ●優(yōu)秀的數(shù)據(jù)分析師的三個特點 。業(yè)務理解:數(shù)據(jù)和業(yè)務結合并產(chǎn)生價值 。工具使用:掌握分析工具、分析模型和分析方法 。溝通表達:掌握高效聽說讀寫的能力 ●數(shù)據(jù)分析的四大步驟是什么 。數(shù)據(jù)抓取:埋點、爬蟲和API 。數(shù)據(jù)清洗:數(shù)據(jù)的完整性、唯一性、準確性和一致性 。數(shù)據(jù)分析:描述性統(tǒng)計、診斷性分析、預測性分析、仿真模擬 。業(yè)務決策:清晰的可視化和完整的分析報告 ●數(shù)據(jù)分析工具簡介 ●Excel、 Python簡介及優(yōu)劣勢分析 Part2、項目初探-員工薪水探索性分析 ●企業(yè)級開發(fā)環(huán)境Jupyter的安裝與基本使用 ●企業(yè)級數(shù)據(jù)處理流程的代碼實現(xiàn) ●PEP8中的導包規(guī)范 ●透析函數(shù)的本質(zhì) ●Pandas的多類型文件處理與數(shù)據(jù)的函數(shù)運算 ●Python數(shù)據(jù)處理的原理與方法 ●Pandas的數(shù)據(jù)迭代邏輯與條件篩選 ●數(shù)據(jù)合并與CRUD ●數(shù)據(jù)的行列以及區(qū)域訪問 ●apply與 lambda的配合 第二周 Part1、如何像數(shù)據(jù)分析師一樣思考 ●互聯(lián)網(wǎng)營銷活動數(shù)據(jù)分析的基本模型 ●描述性統(tǒng)計指標的Excel處理(以用戶畫像為例) ●用Excel分析數(shù)據(jù)間的相關關系(以波土頓矩陣的四象限分析法為例) ●用Excel進行預測性分析(以電商零售銷量預測案例為例) ●不同類型的數(shù)據(jù)分析 。描述性分析:平均數(shù)、標準差、分布規(guī)律、可視化方法 。診斷性分析:挖掘問題根源,識別依賴關系,找出影響因子 。預測性分析: (線性回歸、邏輯回歸) 。仿真模擬: (以零售倉儲備貨案例為例) ●數(shù)據(jù)可視化的基5大本原則(圖表類型、坐標軸、數(shù)據(jù)細節(jié)、顏色使用、維度展現(xiàn)) Part2、數(shù)據(jù)的科學運算與數(shù)據(jù)探索性分析 ●數(shù)據(jù)探索的目的與方法 ●NumPy數(shù)據(jù)運算的技巧 ?张c非空 。矢量化與切片 。索引的本質(zhì)、作用與花式索引 。常用運算方法與技巧 。降維與堆疊 。多種降維方法的磁盤級區(qū)別 。什么是廣播運算與廣播運算的操作 ●企業(yè)中臟數(shù)據(jù)的常見處理方法 。臟數(shù)據(jù)的分類與產(chǎn)生原因 。企業(yè)中多數(shù)據(jù)源的數(shù)據(jù)產(chǎn)生場景 。使用Pandas進行各類臟數(shù)據(jù)的處理與操作 。數(shù)據(jù)的鏈式運算 。數(shù)據(jù)缺失、填充與標準化 ●特殊的數(shù)據(jù):日期 。時間格式與時間戳 。時間戳的原理與時間換算 。使用Pandas進行時間的運算 第三周 Part1、不做只懂技術不懂業(yè)務的“工具人” ●B站用戶的用戶分層案例講解 ●蒙特卡羅模擬+亞馬遜電子書案例進行講解 ●項目講解 bilibili站內(nèi)CPC廣告優(yōu)化 ●bilibili廣告系統(tǒng)相關背景及數(shù)據(jù)介紹(feeds廣 告、banner廣 告、卡片廣告) ●CPC廣告投放系統(tǒng)的要素介紹(關鍵詞、單次點擊競價、單日預算等) ●bilibili站內(nèi)CPC廣告業(yè)務場景與優(yōu)化問題介紹(廣 告ROI較低,投放不精準) ●bilibili站內(nèi)CPC廣告業(yè)務優(yōu)化思路及數(shù)據(jù)分析過程(客單價、訂單量、單個訂單平均廣告花費交叉分析) ●CPC廣告優(yōu)化在復雜業(yè)務環(huán)境下需要考慮的要素(惡意點擊、由圖片加載失敗導致的曝光失敗、廣告主品牌權重、廣告主與流量主的品牌匹配度等) Part2、數(shù)據(jù)分析與自動化辦公必備利器:數(shù)據(jù)可視化 ●顏色主題的設置原則 ●數(shù)據(jù)可視化常用圖形及其應用場景 ●如何用圖形講好故事 ●概覽最火圖形庫Matplotlib ●圖形疊加 。畫布布局 。多維數(shù)據(jù)可視化 。數(shù)據(jù)分組 ●圖繪制的關鍵步驟 。數(shù)據(jù)獲取、顏色配置、添加說明、多圖堆疊、網(wǎng)格與軸等 ●顏色生成器開發(fā) 。什么是RGB與RGBA 。顏色的組成 第四周 Part1、數(shù)據(jù)分析項目實戰(zhàn)(一):電商平臺訂單報表分析 ●互聯(lián)網(wǎng)電商平臺數(shù)據(jù)分析的一般思路 ●bilili會員購平臺業(yè)務背景及數(shù)據(jù)介紹 ●訂單數(shù)據(jù)的數(shù)據(jù)分析基本思路一 制作可視化報表 ●可視化報表涉及到的Python知識點講解 ●b站會員購訂單數(shù)據(jù)的宏觀分類與分析思路(待支付、已支付、已發(fā)貨訂單數(shù)據(jù)分類,不同分類的數(shù)據(jù)分析要點) ●b站會員購訂單數(shù)據(jù)的微觀分類與分析思路(訂單下單時間的小時、分鐘分類,不同分類的數(shù)據(jù)分析要點) ●b站會員購訂單數(shù)據(jù)多表格數(shù)據(jù)的匯總與分析(周訂單波動分析、一周不同時間用戶購物習慣差異分析) ●b站會員購訂單數(shù)據(jù)針對用戶屬性判別的分析(下單時間+客單價->用戶活躍時間+購買能力-→用戶身份(學生/社會人) ) ●b站會員購訂單數(shù)據(jù)針對地區(qū)品牌滲透度判別的分析(送貨地區(qū)+客單價→地區(qū)品牌滲透都+地區(qū)用戶購買力-→頭部市場/長尾市場地區(qū) 劃分) ●訂單可視化報表與用戶畫像的關系(引出下個章節(jié)的相關內(nèi)容) ●結合該章節(jié)內(nèi)容介紹相關就職崗位(電商運營、零售商數(shù)據(jù)分析員、新零售運營) Part2、使用正則進行數(shù)據(jù)的復雜篩選 ●企業(yè)中文本數(shù)據(jù)的產(chǎn)生及處理技巧 ●文本數(shù)據(jù)抽取與格式校驗 。企業(yè)應用軟件如何進行手機號的格式驗證 。網(wǎng)站注冊時如何進行合法郵箱格式驗證 ●文本數(shù)據(jù)抽取的必備技能:正則表達式到底是什么 ●正則表達式及其應用場景 ●正則表達式的知識點組成 。元字符的奧秘 。反義與反義代碼 。限定匹配與限定符 。分組的基本概念與分組匹配, 。后向引用 。貪婪與非貪婪 ●分詞的多模式 ●初探詞云 ●股票網(wǎng)站數(shù)據(jù)抓取 。身份偽裝進行數(shù)據(jù)抓取 。正則的數(shù)據(jù)匹配 。數(shù)據(jù)持久化的方法 。正則結合前端技術進行復雜數(shù)據(jù)處理的技巧 第五周 Part1、數(shù)據(jù)分析項目實戰(zhàn)(二):用戶畫像體系 ●互聯(lián)網(wǎng)電商平臺入駐商數(shù)據(jù)分析的一般思路 ●亞馬遜相關數(shù)據(jù)介紹(前臺用戶review數(shù)據(jù)+訂單數(shù)據(jù)) ●電商運營的殺手锏一 用戶畫像體系 ●什么是用戶畫像體系(用戶屬性數(shù)據(jù)+用戶行為數(shù)據(jù)) ●搭建用戶畫像體系(幫助電商平臺入駐方獲知自身的品牌定位和產(chǎn)品定位,同時梳理用戶的搜索行為習慣) 。用戶畫像在互聯(lián)網(wǎng)業(yè)務中的應用場景和業(yè)務價值 。獲客:如何進行拉新,通過更精準的營銷獲取客戶 。粘客:個性化推薦,搜索排序,場景運營等 。留客:流失率預測,分析關鍵節(jié)點降低流失率 ●用戶的基本屬性:性別、年齡、受教育程度、地域分布等 ●用戶的行為屬性:下單時間、促銷敏感度、評論敏感度 ●用戶的偏好屬性:用戶的加購數(shù)據(jù) ●用戶畫像涉及到的Python知識點講解(文件讀取,地圖可視化,數(shù)據(jù)可視化技術,爬蟲抓取技術) ●如何搭建亞馬遜美國市場用戶畫像體系(數(shù)據(jù)可視化) ●用戶地區(qū)分布分析(帕累托圖,找到二八分布的頭部市場) ●用戶購買習慣分析(折線圖, 找到不同地區(qū)用戶的購物高峰時間幫助品牌商進行價格實時調(diào)整實現(xiàn)利潤最大化,電商價格歧視相關概念及技術介紹) ●價格地區(qū)分布分析(地圖可視化,與用戶地區(qū)分布分析結合進行交叉分析,找到長尾市場中的高客單價潛在市場) ●用戶畫像對于多品牌矩陣運營的幫助(多電商入駐商店鋪定位分析+市場分析) ●用戶畫像對于用戶搜索習慣的分析(review數(shù)據(jù)進行詞頻分析,同時將review數(shù)據(jù)的詞頻分析與產(chǎn)品鏈接標題的詞頻分析相匹配,最終找到潛力市場) ●用戶畫像對于電商團隊管理的幫助(量化運營人員運營成果,避免純KP|考慮的弊端) ●結合該章節(jié)內(nèi)容介紹相關就職崗位(電商 平臺用戶運營、電商入駐商數(shù)據(jù)分析師、垂直電商平臺數(shù)據(jù)分析師、渠道商數(shù)據(jù)分析師、互聯(lián)網(wǎng)公司用戶研究員、廣告投放師) Part2、全鏈路的自動化匯報 ●海量數(shù)據(jù)處理 。多層文件夾與文件的識別 。遞歸與深層遞歸 ”什么是棧與棧溢出 ●郵件與協(xié)議 。網(wǎng)絡協(xié)議劃分與企業(yè)開發(fā)的應用場景 。網(wǎng)絡分層中的7層與5層 。郵件協(xié)議的組成 SMTP與端口 ●郵件自動發(fā)送 。郵件的組成 。郵件中各組件的添加 。附件與圖 ●漂亮的郵件格式 。使用HTML進行郵件格式書寫 。HTML的標簽書寫 。郵件方法的結構化封裝 第六周 Part1、數(shù)據(jù)分析項目實戰(zhàn)(三):以數(shù)據(jù)分析為導向的運營體系搭建 ●流量運營案例:如何用數(shù)據(jù)分析的思路解決廣告優(yōu)化問題 ●電商廣告業(yè)務簡介及傳統(tǒng)分析鏈路數(shù)據(jù)分析 ●什么是漏斗模型及何建立漏斗模型 ●怎么運用漏斗模型優(yōu)化廣告投放 ●多廣告組分析時如何進行優(yōu)化決策 ●電商運營案例:如何利用數(shù)據(jù)分析的思路解決市場分析與倉儲備貨問題 ●倉儲體系數(shù)據(jù)化(簡易計算法、計量計算法、數(shù)學仿真法) ●市場體系數(shù)據(jù)化(微觀:銷量同比/環(huán)比,銷量權重對比,日/周/月銷量對比;宏觀:市場占有率計算,宏觀市場分析,平臺數(shù)據(jù)抓取與分析) ●運營體系數(shù)據(jù)化(從需求角度/競爭角度優(yōu)化關鍵詞,如何量化關鍵詞評分,轉化率分析+用戶訪問深度分析,PV/UV的概念介紹及計算) ●產(chǎn)品運營案例:如何利用數(shù)據(jù)分析的思路使產(chǎn)品快速迭代 ●用戶生命周期與使用習慣的精細化運營(不同生命周期的用戶予以不同的展示頁,A/B test,價格歧視策略) ●合用戶使用習慣的增長黑客法則(如何找到magic數(shù)字, 如何通過埋點使產(chǎn)品使用用戶快速增長) 結合該章節(jié)內(nèi)容介紹相關就職崗位(頭部互聯(lián)網(wǎng)公司產(chǎn)品運營、廣告數(shù)據(jù)分析師、流量數(shù)據(jù)分析師、流量運營、電商數(shù)據(jù)產(chǎn)品經(jīng)理) Part2、深入數(shù)據(jù)分析與人工智能 ●什么是人工智能能及人工智能的知識體系 ●人工智能、機器學習、自然語言處理、深度學習、知識圖譜、大數(shù)據(jù)等多種知識的關系 ●深度剖析人工智能與數(shù)據(jù)分析的關系 ●成為數(shù)據(jù)挖掘工程師與大數(shù)據(jù)工程師的學習路線 ●數(shù)據(jù)挖掘的常用算法模型原理 ;貧w分析的常用分析模型 。線性回歸與邏輯回歸 。聚類分析的原理 。簇的選擇與聚簇 。數(shù)據(jù)集合的劃分 。模型訓練與評分 第七周 Part1、數(shù)據(jù)分析項目實戰(zhàn)(四):亞馬遜Kindle電子書的數(shù)據(jù)化商業(yè)分析, 亞馬遜Kindle商業(yè)分析與騰訊行業(yè)研究相關經(jīng)驗分享 ●業(yè)務分析偏向于戰(zhàn)術指導,商業(yè)分析偏向于戰(zhàn)略指導 ●馬遜Kindle電子書相關數(shù)據(jù)介紹(Hardcover + Paperback + Kindle三種渠道書籍排名數(shù)據(jù)、價格數(shù)據(jù)、review數(shù)據(jù)) ●0-1變量、時間序列變量的介紹,以及多變量線性回歸的概念介紹 ●據(jù)化商業(yè)分析涉及到的Python知識點講解 (多變量回歸、聚類分析、非線性回歸) ●亞馬遜Kindle書籍多渠道商業(yè)分析項目背景介紹(電子書發(fā)售時間對書籍整體銷量的影響、電子書發(fā)售時間對電子書的影響、電子書發(fā)售時間對實體書銷量的影響) ●亞馬遜Kindle書籍多渠道商業(yè)分析數(shù)據(jù)處理思路講解 ●Kindle書籍聚類分析方法講解 ●電子書對實體書銷量影響程度判斷與影響因素確定(價格、發(fā)售時間、review評分等) ●結合該章節(jié)內(nèi)容介紹相關就職崗位(垂直互聯(lián)網(wǎng)公司商業(yè)分析師、頭部電商入駐商商業(yè)分析師、零售/快消行業(yè)數(shù)據(jù)分析師) Part2、互聯(lián)網(wǎng)新貴: SQL與MySQL(-) 企業(yè)中數(shù)據(jù)的分類 與來源 ●數(shù)據(jù)庫的基本劃分 。關系型數(shù)據(jù)庫、非關系型數(shù)據(jù)庫的基本分類與應用場景 ●數(shù)據(jù)與數(shù)據(jù)庫的本質(zhì)MySQL數(shù)據(jù)庫的組成 。字符編碼的多層次設置 。數(shù)據(jù)庫的層次結構 ●數(shù)據(jù)庫的崗位衍生與知識分布 ●DDL、DML、DCL、TCL與各崗位的工作重點 。數(shù)據(jù)庫的權限控制 。防火墻與遠程訪問 。權限與角色 ●數(shù)據(jù)庫的基本操作 。CRUD程序員的日常 。寫入的性能:單條與批量 。數(shù)據(jù)存儲規(guī)范 。數(shù)據(jù)模型 ●條件控制下的更新與刪除,企業(yè)中數(shù)據(jù)刪除的原則與數(shù)據(jù)分析師追溯數(shù)據(jù)的痕跡 ●Python操作數(shù)據(jù)庫的技巧 。不定長多參傳入 。游標, SQL書寫的安全法則 。時間的運算與處理 。commit與fetch 。結束后close的必要與原理 第八周 Part1、常見互聯(lián)網(wǎng)業(yè)務的數(shù)據(jù)分析報告的制作及用戶分層模型 ●實戰(zhàn)項目與業(yè)務邏輯回顧:數(shù)據(jù)報表(數(shù)據(jù)源)→用戶畫像(數(shù)據(jù)分析) →數(shù)據(jù)化運營(決策指導) →商業(yè)分析(宏觀判斷)→分析報告(結論梳理) ●常用的數(shù)據(jù)統(tǒng)計指標 ●互聯(lián)網(wǎng)運營/電子商務運營中統(tǒng)計指標拆解 ●電商網(wǎng)站的指標體系 ●互聯(lián)網(wǎng)產(chǎn)品的指標體系(以AARRR模型為例) ●用戶數(shù)據(jù)指標及其可視化展示: D (DAU、 MAU、新增、留存、渠道來源等) ●行為數(shù)據(jù)指標及其可視化展示: P (PV、UV、轉化率、訪問時長、訪問深度、彈出率等) ●業(yè)務數(shù)據(jù)指標及其可視化展示: G (MV、ARPU、付費人數(shù)、付費率、付費頻次等) ●什么是RFM模型及何構建RFM模型 ●RFM模型實戰(zhàn)結合該章節(jié)內(nèi)容介紹相關就職崗位(頭部互聯(lián)網(wǎng)公司數(shù)據(jù)分析師) Part2、互聯(lián)網(wǎng)新貴: SQL與MySQL(二) ●數(shù)據(jù)庫的基本操作 。SQL查詢數(shù)據(jù)的條件篩選 。子查詢與子查詢的誤區(qū) 。關聯(lián)查詢中的左、右、全 。多表的數(shù)據(jù)模型關系 。分組與排序的細節(jié) ●數(shù)據(jù)庫也能運算 。那些常用且好用的函數(shù) 。數(shù)據(jù)加密與解密的原理 ●數(shù)據(jù)庫在企業(yè)技術架構中的角色,Python操作MySQL 。引擎與安裝引擎 。連接數(shù)據(jù)庫的基本步驟 。連接與連接池 。Pandas的數(shù)據(jù)關聯(lián)合并 ●數(shù)據(jù)庫進階知識講解 ●RFM的代碼處理 ●運算與聚合 第九周 Part1、產(chǎn)品關聯(lián)分析與商品畫像體系實戰(zhàn) ●關聯(lián)度分析 ●商品畫像體系(電商平臺類目的劃分是怎樣的,以騰訊微店的案例講解子類目與母類目的從屬關系,如何通過電商類目劃分與商品數(shù) 據(jù)梳理出電商平臺商品畫像體系) ●搭建商品畫像體系(平臺定位,供應商定位,KA商家與長尾商家的劃分) ●購物籃分析(什么是購物籃分析,啤酒與尿布的案例引導,關聯(lián)分析與購物籃分析的關系,關聯(lián)分析中的支持度、可信度、提升度分析, 購物籃分析對于電商平臺的運營決策輔助) ●產(chǎn)品定位分析(波士頓矩陣概念介紹,金牛型/明星型/瘦狗型/問題型產(chǎn)品及類目的劃分) ●結合該章節(jié)內(nèi)容介紹相關就職崗位(頭部電商公司數(shù)據(jù)分析師) Part2、深入據(jù)可視化化更多圖形數(shù)據(jù)可視化介紹 ●PyEcharts與 PyEcharts基本介紹 ●PyEcharts的圖形結構與研發(fā)理念 ●重構常見的圖形 ●PyEcharts中的那些酷炫圖形以及應用場景 。詞云圖 。雷達圖 。熱力圖 。漏斗圖 。地圖各類3D圖形 ●延展學習的方法 ●數(shù)據(jù)處理的核心技巧 ●聚類分析的雷達展現(xiàn) ●交互式動圖 第十周 數(shù)據(jù)分析師面試準備 ●如何撰寫一份有吸引力的簡歷 ●數(shù)據(jù)分析師的職業(yè)發(fā)展規(guī)劃 數(shù)據(jù)分析師面試的三類問題:技術問題、邏輯問題、業(yè)務問題 。技術問題的準備方法及應對思路 。邏輯問題的準備方法及應對思路 。業(yè)務問題的準備方法及應對思路 ●自測:面試中那些常見的問題 ●面試中你應該如何展現(xiàn)自己
購買主題
本主題需向作者支付 30 資源幣 才能瀏覽
| |
| ||
| ||
| ||
| ||
| ||
| ||
| ||
| ||
| ||
小黑屋|資源共享吧 ( 瓊ICP備2023000410號-1 )
GMT+8, 2025-1-27 12:41 , Processed in 0.079610 second(s), 16 queries , MemCached On.