Python - PNLP

Python中文自然語言NLP深度學習與大型語言LLM專家課程

Python Expert in Chinese NLP, Deep Learning, and LLMs
  • 時數:28小時
  • 費用:NT$ 24,000
  • 點數:6.0

選擇查詢分區開課時間

地點 班號 日期 時間 預約
台北 253523 班 2025/04/12 ~ 2025/04/20 每週六日 09:00~17:00 預約
台北 253522 班 2025/06/16 ~ 2025/06/19 每週一二三四 09:00~17:00 預約
台北 258025 班 2025/07/28 ~ 2025/07/31 每週一二三四 09:00~17:00 預約
台北 258026 班 2025/09/22 ~ 2025/09/25 每週一二三四 09:00~17:00 預約
台北 258028 班 2025/10/18 ~ 2025/10/26 每週六日 09:00~17:00 預約
台北 258027 班 2025/11/10 ~ 2025/11/13 每週一二三四 09:00~17:00 預約
高雄 253522ZK 班 2025/06/16 ~ 2025/06/19 每週一二三四 09:00~17:00 預約 Live

目前查無開課時段

詳細開課時間請洽詢業務
新竹、台中、高雄如有上課需求,請參考台北開課日期,洽當地服務人員依需求加開遠距開課日期

聯絡恆逸

教材

恆逸專用教材

課程目標

本課程全面解析自然語言處理(NLP)的各個面向,從基礎的社群媒體資料分析與知識檢索,到進階的大型語言模型(LLM)微調與企業級部署,旨在培養學員具備完整的 NLP 應用開發能力。

課程首先聚焦於社群媒體資料分析,教導學員如何爬取 Meta(Facebook)與 Instagram 上的留言,建立標註訓練集,並透過情感分析與社群圖譜建模,深入解析消費者行為。學員將學習運用 Neo4j 圖資料庫建構用戶-內容-情感關聯圖,並結合 RAG 技術,有效提升 NLP 檢索效能。此外,課程亦涵蓋中文情感分析與分群推薦,教授學員如何結合機器學習與深度學習技術(如 XGBoost、LSTM、BERT),進行自動化標註與建立推薦系統,並透過 Agentic RAG 技術提高標註精度。學員將在標註資料時,運用 思維鏈推理(CoT)技術來提升標註一致性,確保模型能更準確地學習標註標準。

課程進一步深入 LLM 的微調與企業應用,教授 ChatGPT API、LLaMA、Mistral、Gemini、Gemma 等 LLM 的微調技術,並結合 Neo4j 圖資料庫與 RAG,打造專業 AI KM問答系統。學員將學習使用 QLoRA 進行微調,透過 Agentic Workflow 使 AI Agents 能夠動態調整提示詞,優化 LLM 回應能力。在微調過程中,將引導學員使用 CoT 來改善模型的推理過程,特別是在長文本摘要與多步驟推論的應用場景,進一步提升 LLM 的理解與生成能力。

最後,課程將引導學員學習如何優化 LLM,將模型部署至本地環境,並開發企業內部專屬的私有化 LLM 架構,包括模型轉換與量化、企業級 LLM 部署,以及 API 與微服務的建立,讓學員全面掌握 NLP 技術在企業級應用上的實戰能力。

適合對象

  1. 高級軟體開發工程師(Senior Software Engineer)
  2. 大數據研發專家 / 資料科學家(Big Data R&D Specialist / Data Scientist)
  3. 統計與數值分析研究專家(Statistical & Numerical Analysis Researcher)
  4. 中文自然語言處理(NLP)專家(Chinese NLP Specialist)
  5. 大型語言模型微調專家(LLM Fine-Tuning Specialist)
  6. AI Agent 開發與應用專家(LLM-Based AI Agent Development Specialist)

預備知識

本課程將深入探討自然語言處理(NLP)與大型語言模型(LLM)的應用與微調,學員若具備以下基礎技能,將能更順利掌握課程內容:

  1. Python 程式開發能力 具備基礎至中級 Python 程式撰寫能力,能夠進行資料處理與模型開發。建議先修習 恆逸資訊的 「Python 程式設計」 以及 「Python 與機器學習深度學習——使用 Keras 與 TensorFlow」 相關課程,以掌握必要的程式語法與機器學習應用。

  2. 結構化與非結構化資料庫基礎 了解 結構化資料庫(SQL,如 MySQL) 與 非結構化資料庫(NoSQL,如 MongoDB) 的基本概念,熟悉 資料儲存、查詢與管理,以便處理 NLP 應用中的巨量文字資料,並能將知識檢索技術(RAG)與數據處理需求結合。

  3. 機器學習理論基礎(建議具備) 若具備 機器學習(Machine Learning) 的基礎知識,如模型訓練、監督式與非監督式學習的概念,將能幫助學員更深入理解 語言模型(LLM) 的運作原理與應用場景。雖然課程將涵蓋必要的基礎,但 若學員已具備機器學習基礎,學習進度將更加順暢。

本課程將從這些基礎概念出發,逐步帶領學員進入 NLP 應用、模型微調與企業級 AI 解決方案開發,確保學員能在課程中獲得完整的技術實作與應用能力。

課程內容

1.AI的下一世代:ChatGPT 的崛起與自然語言處理 (NLP) 基礎

 ● 自然語言處理 (NLP) 的核心概念:自然語言理解 (NLU) 與自然語言生成 (NLG)

 ● 解析 ChatGPT 與大型語言模型 (LLM) 的架構與運作原理

 ● AI Agents 在 NLP 應用中的角色:動態應對複雜任務的智能代理

2.文字資料採集與前處理

 ● Python 爬蟲 (Web Crawling) 與 Scrapy 框架:實作高效能數據擷取

 ● MongoDB 非結構化資料庫:建構 NLP 文字儲存與檢索系統

 ● 巨量資料集收集與清理:從社群媒體 (Facebook/Instagram) 爬取留言,實作自動化資料清洗與標註

3.機器學習 (ML) 速成:NLP 核心算法

 ● 決策樹 (Decision Tree) 與隨機森林 (Random Forest) 在 NLP 領域的應用

 ● 梯度下降 (Gradient Descent) 的最佳化策略,提升模型訓練效率

4.機率生成模型與分類模型

 ● 貝氏分類 (Bayesian Classification) 在中文語意分析的應用場景

 ● HMM(隱馬爾可夫模型)與 Transformer 在語意建模上的對比

5.關聯詞彙與語言建模 (Tokenization & Embedding)

 ● 中文分詞技術:Ckip、Jieba、Transformers 在 NLP 領域的應用

 ● 語意向量化技術:Word2Vec、Doc2Vec 與預訓練 Transformer 模型的比較

 ● 思維鏈推理 (CoT) 在語義關聯推導的應用

6.文章分類與語意理解

 ● 詞袋模型 (Bag of Words) 與 TF-IDF 特徵工程

 ● Naive Bayes 分類器與 XGBoost 在文本分類的實戰應用

7.情感分析 (Sentiment Analysis) 與細粒度文本分類

 ● Fine-tuning HuggingFace 預訓練模型,解析中文長短句的情感傾向

 ● 使用 Google Play Store 評論數據,訓練基於 Keras/TensorFlow 的 RNN 情感分析模型

 ● 結合 AI Agents,提升情感分析系統的適應性與自動標註精度

8.中文姓名與暱稱的性別預測建模

 ● 訓練中英文姓名性別分類模型,應用於個性化行銷與身份識別

 ● 建構 NLP 索引與標籤查找機制,提升模型準確度

9.自然語言處理應用案例分析

 ● 部署中文姓名預測 API,提供地端預測服務

 ● 廣告投放最佳化:自然語言文章分類在標籤投放中的應用

 ● 品牌輿情監測:Facebook/Instagram 留言探針,實現品牌危機即時預警

 ● 社群數據分析:PTT 熱門新聞摘要與語意關聯分析

 ● 思維鏈推理 (CoT) 在文本理解與推理分析的實戰應用

10.微調 (Fine-tuning) ChatGPT 及 LLM,打造產業專屬 AI 助手

 ● 通用人工智慧 (AGI) 與 LLM 的未來發展趨勢

 ● 企業專屬 LLM 微調:構建自有領域知識庫,提高模型專業性

 ● 合併 QLoRA Adapter 接續遷移式學習 (Transfer Learning) 實作

 ● 微調 OpenAI 模型,構建知識庫助手,建構企業內部知識管理(KM)能力

11.延伸大型語言模型 (LLM) 知識擴增 (RAG) 與 AI Agents 應用

 ● 融合知識檢索 (RAG) 與 OpenAI 生成技術,提升 LLM 回應準確度

 ● 提示詞工程 (Prompt Engineering):運用 LangChain 與 LlamaIndex 進行高效檢索與生成

 ● AI Agents 在 NLP 領域的應用:智能化任務分配與動態回應生成

 ● 防止 AI 幻覺 (Hallucination):LLM 的事實查核技術 (Fact-checking)

 ● 地端 SLM 部署 (GGUF):高效能本地化模型運行與推理加速

學會技能

  1. 運用 Python 爬蟲技術 擷取文章與社群數據,構建 NLP 訓練資料集
  2. 深度學習自動化文章標註 (Tagging),提升文本分類效率
  3. 掌握 NLP 核心模型與演算法:RNN、Bag of Words、TF-IDF、Naive Bayes、XGBoost,應用於詞彙處理與知識萃取
  4. 構建企業級新聞與產業訊息分類系統,透過分群演算法適應不同詞彙分類需求
  5. 訓練企業專屬情感分析模型,強化客服系統的情緒理解,透過 CoT 提升判斷準確度
  6. 開發 NLP Dashboard 戰情室,分析關鍵詞關聯,掌握市場脈動
  7. 社群聆聽 (Social Listening) 中文詞彙分析,透過 Text Cloud & Dashboard 提供決策洞察
  8. 社群用戶特徵分析,透過 Facebook 暱稱、Instagram 姓名預測性別,進行消費者 Profiling
  9. 設計 NLP 企業應用,將模型封裝為 API 服務,透過 Vectorstore 進行 RAG 問答
  10. 掌握 NLP 模型生命週期管理 (MLOps for NLP),自動更新語料庫、重訓模型
  11. 品牌分析與競品監測,結合社群數據進行 語意分析、行銷策略優化
  12. 掌握 Transformer 與遷移學習 (Transfer Learning),應用於中文 NLP 任務
  13. 微調 (Fine-Tuning) OpenAI 企業專屬模型,透過 Agentic Workflow 動態調整策略
  14. 開發 OpenAI Assistants API,透過 CoT 提升複雜問題推理能力,打造精準知識應用
  15. 建構 GPTs 應用,建立 API 串接機制,透過 AI Agents 進行語境優化
  16. 微調 HuggingFace 上的 LLaMA、Mistral、Gemma 等開源模型,提升 LLM 在企業小語言模型 (SLM) 應用
  17. 應用 RAG (Retrieval-Augmented Generation),透過 CoT 提升 LLM 知識擴增與推理能力
  18. 整合 LangChain、LangGraph、LlamaIndex 與向量資料庫,透過 AI Agents 優化知識檢索,打造企業內部知識管理 (KM) 系統
  19. 將 LLM 轉換為 GGUF 格式,優化推理效能,使個人電腦能透過 CPU 部署私有模型
  20. 部署離線私有化 LLM,確保企業資料安全,透過 員工對話處理生成增強式學習語料,自我微調模型

備註事項

課程優惠方案:

學生優惠價:參加校園IT職涯學習護照方案,享有5折優惠價NT$12,000元