Python - PNLP
Python中文自然語言NLP深度學習與大型語言LLM專家課程
Python Expert in Chinese NLP, Deep Learning, and LLMs
- 時數:28小時
- 費用:NT$ 24,000
- 點數:6.0
選擇查詢分區開課時間
地點 | 班號 | 日期 | 時間 | 預約 |
---|---|---|---|---|
台北 | 253523 班 | 2025/04/12 ~ 2025/04/20 每週六日 | 09:00~17:00 | 預約 |
台北 | 253522 班 | 2025/06/16 ~ 2025/06/19 每週一二三四 | 09:00~17:00 | 預約 |
台北 | 258025 班 | 2025/07/28 ~ 2025/07/31 每週一二三四 | 09:00~17:00 | 預約 |
台北 | 258026 班 | 2025/09/22 ~ 2025/09/25 每週一二三四 | 09:00~17:00 | 預約 |
台北 | 258028 班 | 2025/10/18 ~ 2025/10/26 每週六日 | 09:00~17:00 | 預約 |
台北 | 258027 班 | 2025/11/10 ~ 2025/11/13 每週一二三四 | 09:00~17:00 | 預約 |
高雄 | 253522ZK 班 | 2025/06/16 ~ 2025/06/19 每週一二三四 | 09:00~17:00 | 預約 Live |
目前查無開課時段
詳細開課時間請洽詢業務
新竹、台中、高雄如有上課需求,請參考台北開課日期,洽當地服務人員依需求加開遠距開課日期
教材
課程目標
本課程全面解析自然語言處理(NLP)的各個面向,從基礎的社群媒體資料分析與知識檢索,到進階的大型語言模型(LLM)微調與企業級部署,旨在培養學員具備完整的 NLP 應用開發能力。
課程首先聚焦於社群媒體資料分析,教導學員如何爬取 Meta(Facebook)與 Instagram 上的留言,建立標註訓練集,並透過情感分析與社群圖譜建模,深入解析消費者行為。學員將學習運用 Neo4j 圖資料庫建構用戶-內容-情感關聯圖,並結合 RAG 技術,有效提升 NLP 檢索效能。此外,課程亦涵蓋中文情感分析與分群推薦,教授學員如何結合機器學習與深度學習技術(如 XGBoost、LSTM、BERT),進行自動化標註與建立推薦系統,並透過 Agentic RAG 技術提高標註精度。學員將在標註資料時,運用 思維鏈推理(CoT)技術來提升標註一致性,確保模型能更準確地學習標註標準。
課程進一步深入 LLM 的微調與企業應用,教授 ChatGPT API、LLaMA、Mistral、Gemini、Gemma 等 LLM 的微調技術,並結合 Neo4j 圖資料庫與 RAG,打造專業 AI KM問答系統。學員將學習使用 QLoRA 進行微調,透過 Agentic Workflow 使 AI Agents 能夠動態調整提示詞,優化 LLM 回應能力。在微調過程中,將引導學員使用 CoT 來改善模型的推理過程,特別是在長文本摘要與多步驟推論的應用場景,進一步提升 LLM 的理解與生成能力。
最後,課程將引導學員學習如何優化 LLM,將模型部署至本地環境,並開發企業內部專屬的私有化 LLM 架構,包括模型轉換與量化、企業級 LLM 部署,以及 API 與微服務的建立,讓學員全面掌握 NLP 技術在企業級應用上的實戰能力。
適合對象
- 高級軟體開發工程師(Senior Software Engineer)
- 大數據研發專家 / 資料科學家(Big Data R&D Specialist / Data Scientist)
- 統計與數值分析研究專家(Statistical & Numerical Analysis Researcher)
- 中文自然語言處理(NLP)專家(Chinese NLP Specialist)
- 大型語言模型微調專家(LLM Fine-Tuning Specialist)
- AI Agent 開發與應用專家(LLM-Based AI Agent Development Specialist)
預備知識
本課程將深入探討自然語言處理(NLP)與大型語言模型(LLM)的應用與微調,學員若具備以下基礎技能,將能更順利掌握課程內容:
Python 程式開發能力 具備基礎至中級 Python 程式撰寫能力,能夠進行資料處理與模型開發。建議先修習 恆逸資訊的 「Python 程式設計」 以及 「Python 與機器學習深度學習——使用 Keras 與 TensorFlow」 相關課程,以掌握必要的程式語法與機器學習應用。
結構化與非結構化資料庫基礎 了解 結構化資料庫(SQL,如 MySQL) 與 非結構化資料庫(NoSQL,如 MongoDB) 的基本概念,熟悉 資料儲存、查詢與管理,以便處理 NLP 應用中的巨量文字資料,並能將知識檢索技術(RAG)與數據處理需求結合。
機器學習理論基礎(建議具備) 若具備 機器學習(Machine Learning) 的基礎知識,如模型訓練、監督式與非監督式學習的概念,將能幫助學員更深入理解 語言模型(LLM) 的運作原理與應用場景。雖然課程將涵蓋必要的基礎,但 若學員已具備機器學習基礎,學習進度將更加順暢。
本課程將從這些基礎概念出發,逐步帶領學員進入 NLP 應用、模型微調與企業級 AI 解決方案開發,確保學員能在課程中獲得完整的技術實作與應用能力。
課程內容
1.AI的下一世代:ChatGPT 的崛起與自然語言處理 (NLP) 基礎
● 自然語言處理 (NLP) 的核心概念:自然語言理解 (NLU) 與自然語言生成 (NLG)
● 解析 ChatGPT 與大型語言模型 (LLM) 的架構與運作原理
● AI Agents 在 NLP 應用中的角色:動態應對複雜任務的智能代理
2.文字資料採集與前處理
● Python 爬蟲 (Web Crawling) 與 Scrapy 框架:實作高效能數據擷取
● MongoDB 非結構化資料庫:建構 NLP 文字儲存與檢索系統
● 巨量資料集收集與清理:從社群媒體 (Facebook/Instagram) 爬取留言,實作自動化資料清洗與標註
3.機器學習 (ML) 速成:NLP 核心算法
● 決策樹 (Decision Tree) 與隨機森林 (Random Forest) 在 NLP 領域的應用
● 梯度下降 (Gradient Descent) 的最佳化策略,提升模型訓練效率
4.機率生成模型與分類模型
● 貝氏分類 (Bayesian Classification) 在中文語意分析的應用場景
● HMM(隱馬爾可夫模型)與 Transformer 在語意建模上的對比
5.關聯詞彙與語言建模 (Tokenization & Embedding)
● 中文分詞技術:Ckip、Jieba、Transformers 在 NLP 領域的應用
● 語意向量化技術:Word2Vec、Doc2Vec 與預訓練 Transformer 模型的比較
● 思維鏈推理 (CoT) 在語義關聯推導的應用
6.文章分類與語意理解
● 詞袋模型 (Bag of Words) 與 TF-IDF 特徵工程
● Naive Bayes 分類器與 XGBoost 在文本分類的實戰應用
7.情感分析 (Sentiment Analysis) 與細粒度文本分類
● Fine-tuning HuggingFace 預訓練模型,解析中文長短句的情感傾向
● 使用 Google Play Store 評論數據,訓練基於 Keras/TensorFlow 的 RNN 情感分析模型
● 結合 AI Agents,提升情感分析系統的適應性與自動標註精度
8.中文姓名與暱稱的性別預測建模
● 訓練中英文姓名性別分類模型,應用於個性化行銷與身份識別
● 建構 NLP 索引與標籤查找機制,提升模型準確度
9.自然語言處理應用案例分析
● 部署中文姓名預測 API,提供地端預測服務
● 廣告投放最佳化:自然語言文章分類在標籤投放中的應用
● 品牌輿情監測:Facebook/Instagram 留言探針,實現品牌危機即時預警
● 社群數據分析:PTT 熱門新聞摘要與語意關聯分析
● 思維鏈推理 (CoT) 在文本理解與推理分析的實戰應用
10.微調 (Fine-tuning) ChatGPT 及 LLM,打造產業專屬 AI 助手
● 通用人工智慧 (AGI) 與 LLM 的未來發展趨勢
● 企業專屬 LLM 微調:構建自有領域知識庫,提高模型專業性
● 合併 QLoRA Adapter 接續遷移式學習 (Transfer Learning) 實作
● 微調 OpenAI 模型,構建知識庫助手,建構企業內部知識管理(KM)能力
11.延伸大型語言模型 (LLM) 知識擴增 (RAG) 與 AI Agents 應用
● 融合知識檢索 (RAG) 與 OpenAI 生成技術,提升 LLM 回應準確度
● 提示詞工程 (Prompt Engineering):運用 LangChain 與 LlamaIndex 進行高效檢索與生成
● AI Agents 在 NLP 領域的應用:智能化任務分配與動態回應生成
● 防止 AI 幻覺 (Hallucination):LLM 的事實查核技術 (Fact-checking)
● 地端 SLM 部署 (GGUF):高效能本地化模型運行與推理加速
學會技能
- 運用 Python 爬蟲技術 擷取文章與社群數據,構建 NLP 訓練資料集
- 深度學習自動化文章標註 (Tagging),提升文本分類效率
- 掌握 NLP 核心模型與演算法:RNN、Bag of Words、TF-IDF、Naive Bayes、XGBoost,應用於詞彙處理與知識萃取
- 構建企業級新聞與產業訊息分類系統,透過分群演算法適應不同詞彙分類需求
- 訓練企業專屬情感分析模型,強化客服系統的情緒理解,透過 CoT 提升判斷準確度
- 開發 NLP Dashboard 戰情室,分析關鍵詞關聯,掌握市場脈動
- 社群聆聽 (Social Listening) 中文詞彙分析,透過 Text Cloud & Dashboard 提供決策洞察
- 社群用戶特徵分析,透過 Facebook 暱稱、Instagram 姓名預測性別,進行消費者 Profiling
- 設計 NLP 企業應用,將模型封裝為 API 服務,透過 Vectorstore 進行 RAG 問答
- 掌握 NLP 模型生命週期管理 (MLOps for NLP),自動更新語料庫、重訓模型
- 品牌分析與競品監測,結合社群數據進行 語意分析、行銷策略優化
- 掌握 Transformer 與遷移學習 (Transfer Learning),應用於中文 NLP 任務
- 微調 (Fine-Tuning) OpenAI 企業專屬模型,透過 Agentic Workflow 動態調整策略
- 開發 OpenAI Assistants API,透過 CoT 提升複雜問題推理能力,打造精準知識應用
- 建構 GPTs 應用,建立 API 串接機制,透過 AI Agents 進行語境優化
- 微調 HuggingFace 上的 LLaMA、Mistral、Gemma 等開源模型,提升 LLM 在企業小語言模型 (SLM) 應用
- 應用 RAG (Retrieval-Augmented Generation),透過 CoT 提升 LLM 知識擴增與推理能力
- 整合 LangChain、LangGraph、LlamaIndex 與向量資料庫,透過 AI Agents 優化知識檢索,打造企業內部知識管理 (KM) 系統
- 將 LLM 轉換為 GGUF 格式,優化推理效能,使個人電腦能透過 CPU 部署私有模型
- 部署離線私有化 LLM,確保企業資料安全,透過 員工對話處理生成增強式學習語料,自我微調模型
備註事項
課程優惠方案:
學生優惠價:參加校園IT職涯學習護照方案,享有5折優惠價NT$12,000元
相關連結
說明會資訊
-
台北場次
-
線上研討會場次
台北恆逸教育訓練中心
- 02-25149191
- 02-25149292
- 台北市松山區復興北路99號14樓
新竹恆逸教育訓練中心
- 03-5723322
- 03-5745738
- 新竹市光復路二段295號3樓之2
台中恆逸教育訓練中心
- 04-23297722
- 04-23102000
- 台中市西區臺灣大道二段309號2樓
高雄恆逸教育訓練中心
- 07-5361199
- 07-5361698
- 高雄市苓雅區新光路38號4樓之1