-
GPT‑5 調參實戰指南:reasoning_effort × verbosity,三步把速度、成本、品質一次調好
從情境、參數影響、調參策略到驗證門檻,一篇學會用 reasoning_effort × verbosity 做可治理的 GPT‑5 產品化工作流。附閾值表、回退偽碼與下載檢查表。
-
使用 OpenAI Finetune API 微調出自己的模型(附程式碼)
今天這篇要教大家如何使用 OpenAI Finetune API 微調出自己的模型。 想必大家都學會使用網頁版 ChatGPT,最近 OpenAI 又推出了比 GPT-3 便宜十倍的 ChatGPT API,想必未來也有...
-
[PyTorch] 使用 torch.distributed 在單機多 GPU 上進行分散式訓練
Finetune 語言模型所需要的 GPU memory 比較多,往往會需要我們能夠利用到多顆 GPU 的資源。今天這篇文章會說明 DataParallel 和 DistributedDataParallel + Dis...
-
【Python】複製一份 conda 環境的各種方式
使用 .yml 檔案 將當前環境設置輸出為 environment.yml ,再用來創建配置一致的新環境 更新現有環境 在 environment.yml 中對 pip 安裝指令加參數 [ref] 使用 .txt 檔案 ...
-
【自然語言處理】Longformer 中文長文本 RoBERTa 模型 – 新聞分類實作
使用 pre-trained model BERT 進行各種 NLU 下游任務 fine-tuning 時,會有輸入限制 512 字符的限制,真實世界文章往往超過這個長度,因此如何應用 BERT 到長文本上是一個重要的議...
-
【2021 Shopee Code League】解題紀錄|Week1:Multi-Channel Contact Problem
以下用中文解釋題意和解題思考過程,若有誤、更優解等建議,歡迎留言或私訊。 本週題意 基本上希望的目的是,將聯繫蝦皮客服的用戶進行 unify(歸一化),方便計算客服流程的總聯繫次數。由於用戶會用不同信件、手機、基於不同訂...
-
【資料探索性分析】#1 電商零售 – 天貓電商用戶行為
(一)主題 從天貓 TMall 用戶網站行為紀錄,透過視覺化整理: 基本的資料分布 比較不同用戶分組的行為分布差異 *何謂探索性資料分析? 運用 Python 套件進行視覺化或基本統計等方式,讓資料的特點更清楚地被了...
-
【Python 資料科學教程】環境架設、Numpy, Pandas 基礎 – Data Science with Python
不管是提升工作技能或對資料有興趣,都可以簡單上手 Python 數據分析,文末我們將提供 Colab 範本給讀者進行練習。滑到文末 *Colab 是什麼?>> Colaboratory (簡稱為「Colab」...
-
【給初學者】自學三階段,教你入門資料分析 4 大環節
前言 有鑒於資料領域廣受各路工作者喜愛,未來各大公司一定也會導入更多有關數據應用,資料分析能力將成為基本門檻。本篇整理站長當時在初學時期是如何點資料分析技能樹的,希望對讀者們有幫助。 本文大綱走起: 學習資料分析對你的意...
-
Google Tag Manager 教學 (VII) – DOM 元素應用
打給賀,本篇是 Google Tag Manager 中文導覽的第七篇,我們將介紹 DOM 元素變數 的應用。如果你想要跳脫內建變數,紀錄頁面上的內容、用戶資訊到 Google Analytics 或其他第三方平台,你會...