資料科學
-
【Python 資料科學教程】環境架設、Numpy, Pandas 基礎 – Data Science with Python
不管是提升工作技能或對資料有興趣,都可以簡單上手 Python 數據分析,文末我們將提供 Colab 範本給讀者進行練習。滑到文末 *Colab 是什麼?>> Colaboratory (簡稱為「Colab」...
-
【給初學者】自學三階段,教你入門資料分析 4 大環節
前言 有鑒於資料領域廣受各路工作者喜愛,未來各大公司一定也會導入更多有關數據應用,資料分析能力將成為基本門檻。本篇整理站長當時在初學時期是如何點資料分析技能樹的,希望對讀者們有幫助。 本文大綱走起: 學習資料分析對你的意...
-
資料科學初學者建模易犯的錯誤盤點
並非每次我們接觸到的資料,針對每一個預測標的,都有獨立、整理好的特徵值;尤其是在面對時間序列資料時,我們也希望捕捉預測標的,隨時間變化的特徵變化規律。本篇整理時間序列建模時,注意的重點: (I) Scale-transf...
-
【技術分享】tensorflow-gpu 安裝紀錄 (Windows Server 2016)
系統環境確認 Windows Server 2016 GeForce GTX 1070 Ti Python 3.7 Visual Studio 2019 安裝步驟 1. 創建並啟用虛擬環境 2. 安裝正確版本的 tens...
-
【資源整理】資料分析學習路徑整理
職稱滿天飛,資料分析師、數據分析師、資料科學家、數據工程師、AI工程師、機器學習工程師…,我認為有一個光譜可由淺入深分類一下這些跟「數據」搭上邊的工作(例如 日常工作類型的比例是建立資料架構、清理資料、建模還是視覺呈現報...
-
【自然語言處理】認識文本分析|給我一段話,我告訴你重點在哪:對文本重點字詞加權的TF-IDF方法
適逢上週五2019數位奇點獎,敝公司獲得【最佳數據科技創新獎】銅獎;當中的案件我們使用到tfidf產生的文本向量做KMeans分群。正好想試試再讓文章簡單好懂一點,本周就單純只介紹這個文本分析很常用到的統計方法:TF-I...
-
【自然語言處理】認識文本分析|Word2Vec, Doc2Vec 比較 (附Python程式碼)
本篇筆記 Python自然語言處理入門的常用方法 Word2Vec,及其延伸:Doc2Vec,表述他們之間的關聯,並以Python實作比較不同方法分辨同樣兩個語句的效果。(介於中間的還有Sent2Vec,概念與Doc2V...
-
【資料分析】認識統計顯著性|A/B Testing 觀測數值增減多少才是顯著有效?
前言 不論是廣告投放或行銷中的A/B Test,對結果的評斷和優化,都是數據分析的環節之一。避免看到數字就憑著主觀解讀,而是設法找尋具科學證據的解釋,也是數據分析師的基本素養。 本文介紹A/B Testing觀測結果的統...
-
【講座整理】 MySQL | Lesson 0: Installation & Permission
Installation 透過 sudo yam 此時會先check root password 透過 docker $ docker images 開啟 一個container,在那邊啟動MySQL (Data 就會存...