資料科學
-
RAG技術終極入門:基礎架構與工作原理詳解
RAG 技術概述 RAG(Retrieval Augmented Generation,檢索增強生成)是一種結合了大規模語言模型(LLM)與外部知識源檢索的技術框架,旨在提升問答能力和內容生成的準確性。本章將介紹 RAG...
-
全參數微調、PEFT、提示工程和RAG:哪種 LLM 導入策略最適合我?
隨著 AI 技術的不斷進步,企業正越來越多地尋求將大型語言模型(LLM)整合到其業務流程中。這些強大的工具提供了無限的可能性,從自動化客戶服務到提供深度資料分析。然而,選擇最適合特定業務需求的 LLM 調整策略可能是一個...
-
從 Transformer 到 Kansformer? KAN 網絡以結構優化提高模型參數效率與可解釋性
近年來,深度學習技術在多個領域實現了突破性進展,從語言處理到影像識別,無不體現了其強大的學習能力。而在這一進步的核心,多層感知器(MLP)一直扮演著基石的角色。MLP,也被稱為全連接前饋神經網絡,是深度學習模型的基礎構建...
-
使用 Docker 快速部署最新版 Neo4j 資料庫
在本教學中,我們將學習如何使用 Docker 快速部署 Neo4j 社群版資料庫。我們將採用 docker-compose 來簡化部署過程。以下是詳細的步驟和設定說明。 前置準備 在開始之前,確保你的系統上已安裝 Doc...
-
【論文筆記】DCFEE:基於自動標記訓練數據的文檔級中文金融事件抽取系統
抽取金融事件能幫助用戶獲得競爭對手的戰略,預測股票市場做出正確的投資決策。舉例來說,股權凍結事件將對公司產生不利影響,股票持有者應迅速判斷避險
-
使用 OpenAI Finetune API 微調出自己的模型(附程式碼)
今天這篇要教大家如何使用 OpenAI Finetune API 微調出自己的模型。 想必大家都學會使用網頁版 ChatGPT,最近 OpenAI 又推出了比 GPT-3 便宜十倍的 ChatGPT API,想必未來也有...
-
[PyTorch] 使用 torch.distributed 在單機多 GPU 上進行分散式訓練
Finetune 語言模型所需要的 GPU memory 比較多,往往會需要我們能夠利用到多顆 GPU 的資源。今天這篇文章會說明 DataParallel 和 DistributedDataParallel + Dis...
-
經典 NLP 任務標籤生成:串接非官方 ChatGPT API
這篇文章紀錄我串接非官方 ChatGPT API 「試圖」取得 NLP 資訊抽取任務標籤的過程。結論是...
-
Git 協作不可不知的重要指令
以下整理 套件開發協作時常遇到與用到的 Git 指令: SSH Key 與 HTTPS 的差別 其中 <repo_link> 的開頭有 https:// 和 git@ 兩種: git@ 開頭:需在 Githu...
-
【資料探索性分析】#1 電商零售 – 天貓電商用戶行為
(一)主題 從天貓 TMall 用戶網站行為紀錄,透過視覺化整理: 基本的資料分布 比較不同用戶分組的行為分布差異 *何謂探索性資料分析? 運用 Python 套件進行視覺化或基本統計等方式,讓資料的特點更清楚地被了...