Skip to content

Twinkle AI 網站的規劃 #17

Description

@w-club

這是根據我的背景與對社群的認識所先想到的框架與規劃。
https://docs.google.com/document/d/1yRFyu070XnQjrs4fW2kz4UoZNzifBIaTi2fNFeCQalg/edit?usp=sharing

這些資料都是現有的,然後整理起來。我們可以先排版面,再做修改。英文的部份我會再補上。
網站可以用這些資料當作基礎。


Hero Section (先保持原本的OK)

關於 Twinkle AI:我們為什麼要做這件事?
2024 到 2025 這兩年,AI 的發展快到讓人有點跟不上。雖然現在的模型已經很強,但我們在實際使用中發現,很多模型在處理繁體中文時,還是沒辦法精準抓到我們平常說話的語感、生活常識或那些細微的邏輯。
Twinkle AI 的想法很簡單:語言就是生活的一部分。如果未來的數位工具沒辦法理解這些細節,我們熟悉的說話方式就會在演算法中慢慢變淡。因此從 2025 年初開始,我們著手整理在地資料並投入調校,目標很明確,就是要做出一個真正聽得懂我們、對答起來自然且順手的模型。

訓練繁體中文模型
我們專注於在效能與輕量化之間取得平衡,開發出符合在地需求的語言模型:
T1 模型:基於 Gemma-3-4B 架構進行深入調校,針對台灣在地知識與邏輯推理進行強化,提供流暢且精準的互動體驗。
Formosa-1:於 2025 年 4 月 4 日 正式推出,以 Llama-3.2-3B 為核心基礎。這款模型是我們早期對繁體中文語境探索的重要里程碑,展現了卓越的基礎對話能力。
第四號太空人誕生:Twinkle Voice 新的模型支線
[可以引流到各個modal card]

打造開源繁體中文資料集
高品質的資料是模型的靈魂。我們並非單純累積資料量,而是專注於**「資料淨化與語境校準」**。
目前的資料來源涵蓋公開政府資訊、在地社群討論及台灣文學檔案。在資料整理上,我們開發了一套自動化過濾機制,精準篩選掉非在地慣用語(例如將常用的「資訊」誤稱為「信息」的用法」),並建立結構化的資料庫,確保模型學習到的是最道地、最正確的台灣繁體中文。

評測模型在繁體語境能力
為了量化模型對台灣文化的理解深度,我們不僅使用傳統的基準測試,更開發了專門的工具:
Eval 框架:針對台灣法律、地理、生活常識設計的評測集。
eval-analyzer:這套工具能分析模型輸出的詞彙分佈與語法結構。透過 eval-analyzer 的開發成果,我們能有效找出模型在處理特定台灣用語時的弱項,並進行針對性的精進,確保 AI 不會出現文化上的誤解。
Leaderboard 連結與說明

提供教育推廣
Twinkle AI 的最終目標是成為人才孵化器。我們相信,只有當更多人理解並掌握 AI,這項技術才能真正改善社會。
學習共同體:透過 Podcast 分享前沿技術、舉辦**「深夜實堂」**線上實做課程,以及定期的線上讀書會,讓技術不再有門檻。
實體連結:舉辦實體聚會促進交流,並結合 Formosa Vision 國家文化記憶庫,讓參與者能親手將文化記憶轉化為 AI 的知識來源。
[ 點擊進入教育推廣分頁 了解更多 ... ]

媒體活動
現在與未來: 由OCF的帶領之下,我們會在FOSDEM推廣我們所在做的事情
過去新聞與活動:
首次實體聚會,

iThome (2025/11):開源 AI 技術 x 社群接力,臺灣開源邁向韌性新局:奠基臺灣主權視覺資料...
(這篇有詳細提到 Formosa Vision 專案)。
DIGITIMES (2025/11):打造屬於台灣的 AI 助理 宸泗與 Twinkle AI 以國網中心算力推動在地智慧應用

iThome (2025/07):奧義智慧攜手臺灣 AI 業者 APMIC,打造新世代 AI 防火牆
(提及選用 Twinkle AI 的 F1 模型進行安全評測)。

[ 點擊進入媒體活動分頁 了解更多 ... ]


教育與推廣
這裡主要是分享我們在技術實作中的筆記與經驗。我們希望能透過不同形式的討論,讓大家能一起理解 AI 內部的運作邏輯,並培養出真正具備開發能力的人才。

🎙️ Twinkle Podcast
開發者的實戰經驗與體會。
EP00 | LoRA 風味餐的踩雷學習 - 阿謙
EP01 | Freelance Developer 的真實日常:挑戰、成就與體會 - Phidias
EP02 | 從知識碎片到深度交流:AILogora 的初衷 - ChiChieh
EP03 | 語音大腦崛起:邁向讓機器聽懂你、用聲音回應你的時代 - Ethan

🌙 深夜實堂
晚上 22:00 還在電腦前?不如來上課吧。
我們專注於繁中模型的研究與實作,把技術細節拆解成可以執行的 Lab。如果你想實際動手調校模型,這裡有我們整理的資源。
GitHub Repository: ai-twinkle/llm-lab
(繁中模型研究與實作的專屬 Lab)

📚 熬夜書坊
把基礎理論拆開來看。
目前我們固定討論 《Build a Large Language Model (From Scratch)》 這本書。我們不只是快速翻過,而是會針對書中的內容進行拆解,並在線上分享會中把原文內容整理成容易理解的筆記。
這裡就是一個大家聚在一起交換心得的空間。我們會分享實作中的細節,有弄不清楚的地方就提出來討論,目標是讓參與的人都能真正理解程式碼背後的邏輯。如果你也想從底層開始理解 LLM,歡迎隨時加入我們。


新聞與活動
2026.01.03 | Twinkle AI 一週年生日趴:從線上連結到實體共創
Twinkle AI 在 2026 年初迎來了具備指標意義的一週年紀錄。這不僅是我們的週年慶,更是社群成立以來的第一次正式實體見面會。這場聚會象徵著我們從線上的技術討論,正式轉化為一個強大且堅定的線下生態圈。
社群起源與轉型
社群起源於 2025 年 1 月 2 日,最初以 Llama Taiwan 之名成立,初衷是為了收集 Llama-3.2-Taiwan 模型的使用者回饋。隨著參與人數增加,我們迅速轉型為專門討論台灣繁體中文模型訓練的技術社群,更廣泛地集結眾人智慧,共同完成多項有趣的開源專案。
超乎預期的熱情:從 40 到 70 的連結
這次聚會原本預計約 40 人參加,沒想到現場最終湧入了超過 70 位夥伴。更令人感動的是,有群友為了這場聚會,特別從高雄遠道而來。這份熱情證明了台灣開發者對於開源價值的認同,也讓我們看見了在地 AI 社群的強韌生命力。
活動重點紀錄:
成果發表: 現場展示了這一年來各項已發表及尚未公開的研發成果。
實體交流: 透過面對面的互動,讓夥伴們不再只是線上的網友,而是建立起真實的合作夥伴關係。
技術分享 (Lightning Talks): 內容涵蓋模型訓練、Agent 實作及未來趨勢,展現社群深厚的技術底蘊。
感謝各位在過去一年中的付出。雖然這段路程中經歷過挑戰,也曾有夥伴離開,但更多人因為相信開源的價值而選擇留下,並用自己的力量打造讓更多人受惠的專案。這一年來的每一份成果,都是由每一位夥伴共同奠定的基石。

2025 IT Matters Awards | 開源社群貢獻獎
「這份肯定,是屬於每一位參與者的榮耀。」
Twinkle AI 社群於今年首度參加由 IMA 資訊經理人協會主辦的 IT Matters Awards,並在眾多優秀專案中脫穎而出,榮獲「開源社群貢獻獎」。這次獲獎的契機源自社群與台灣大哥大在開源項目上的深度合作,我們將三、四月間累積的社群成果進行整理與投件,最終獲得評審團的專業認可。
能在松菸文創 14 樓的頒獎典禮現場,與 PyCon、SITCON 等資深開源社群並列獲獎,對 Twinkle AI 而言是極大的鼓舞。這不僅是對我們過去技術產出的肯定,更標誌著社群在推動在地 AI 技術生態上邁出了踏實的一步。
「這份獎盃屬於每一位夥伴,因為有你們,社群才能得到這份肯定。榮耀歸屬於大家,Enjoy!」
在典禮現場與許多資深社群交流後,我們深刻感受到 Twinkle AI 仍是一個非常年輕的社群。面對人才留任與技術傳承等社群共同挑戰,這座獎盃也是一個契機,讓我們思考社群未來的轉型方向,如何在維持技術活力的同時,建立更具韌性的夥伴關係。
獲獎名單: 2025 IT Matters Awards 得獎名單

2025.11 | 發表 Formosa Vision:建立在地視覺語境資料集
Twinkle AI 團隊正式推出 Formosa Vision 計畫,旨在解決國際大型視覺語言模型(VLM)對在地影像陌生、容易產生文化誤判的問題。我們從國家文化記憶庫篩選出數千筆具備在地脈絡的圖文資料,透過精確的 Data Cleaning 與語境校準,確保 AI 能正確辨識並理解如古道、眷村、馬祖戰地等特有景觀。此專案除了產出資料集,更將 Twinkle Gallery 訓練平台與相關程式碼全面開源,期望透過技術共享,精進模型對繁體中文多樣語意的理解深度。

2025-11-14
開源 AI 技術 x 社群接力,臺灣開源邁向韌性新局:奠基臺灣主權視覺資料,打造理解在地文化的 AI 模型 | iThome

2025.11 | 參與 TAIWAN AI RAP 應用成果發表
這段期間,Twinkle AI 的技術成果於國科會與國研院主辦的成果展中亮相。我們與宸泗工作室聯名合作,展示了運用平台技術打造的台灣首款小型推理模型,體現了地端模型在日常生活應用的潛力。

2025-11-12
落實主權 AI,國科會展示 TAIWAN AI RAP 與 TAIDE 應用成果 | TechNews 科技新報

2025-11-11
國研院展示AI RAP成果 吳誠文:算力設備台灣有主場優勢,但設計應用是另一關鍵 - 要聞 - 工商時報

2025-11-11
主權AI驅動革新,百業共創智慧臺灣 TAIWAN AI RAP與TAIDE展現應用成果 | 國家實驗研究院

2025.09.17 | Generative AI 小聚 (September 2025)
講題:GPT-OSS:從訓練到推論的硬體需求全解析
於九月份的 Generative AI 社群聚會中,我們從實務開發角度出發,解析開源模型在不同階段的硬體架構需求。 內容涵蓋從模型訓練階段到後端推論部署的資源配置,為開發者在選擇運算硬體與規劃架構時提供具體的參考依據。
活動時間: 2025/09/17 (三) 19:40 - 19:50
活動地點: SPARKFUL (臺北市大同區重慶北路一段1-1號12樓)
相關連結: 活動議程內容 | KKTIX 報名頁面

2025.09.10 | 2025 台灣人工智慧年會 (Taiwan AI Academy Annual Conference)
講題:Art of GRPO Training (Lighting talk)
在中央研究院舉辦的年度 AI 盛會中,我們針對 GRPO (Group Relative Policy Optimization) 訓練技術進行分享。 本次演講著重於如何透過強化學習精進模型的邏輯推理能力,並與現場專家交流在實際調校過程中的技術心得。
活動時間: 2025/09/10 (三) 15:16 - 15:28
活動地點: 中央研究院人文科學館國際會議廳
相關連結: 活動議程 | 購票資訊

2025.07 AI 產業生態暨多元人才賦能推動計畫 - AI 技術小聚

在數位發展部指導的「AI 產業生態暨多元人才賦能推動計畫」中,Twinkle AI 獲邀在第四場次進行技術分享。我們將與現場的產、官、學界夥伴,共同交流繁體中文模型的調校心得與實務開發經驗,並探討如何建立更完整的在地 AI 技術生態。
活動日期: 2025/07/30 13:30 ~ 16:00
活動地點: 臺北市大同區承德路三段 287 號
計畫總時程: 2025/05/09 ~ 2025/11/28
計畫組織架構:
指導單位: 數位發展部
主辦單位: 數位發展部數位產業署
協辦單位: 財團法人資訊工業策進會 ALC Taipei 國立高雄大學 國立臺東大學 中央研究院資訊科學研究所 Twinkle AI 社群 國立屏東科技大學 開放文化基金會 (OCF) PostgreSQL 台灣使用者社群

2025.07 | 參與 CraftCon Taiwan 奧義 AI 資安年會
[Agentic AI x Blue Team x Red Team]
Twinkle AI 與 APMIC 聯合開發的 3B 規模開源模型 F1,受邀作為奧義智慧最新資安防護技術 XecGuard 的實測基礎。 透過實戰演練,展示了在地模型在搭配安全調校模組後,於防禦惡意攻擊上的優異韌性。
活動名稱: CraftCon Taiwan 2025 奧義第二屆 AI 資安年會
活動日期: 2025/07/04 09:30 - 17:00
活動地點: 格萊天漾大飯店 13 樓 格萊廳(臺北市萬華區艋舺大道 101 號)

2025.07 | 強化 AI 模型安全韌性:XecGuard 發表與 F1 實測成果
奧義智慧與 APMIC 達成戰略合作,正式發表業界首款防禦導向的 AI 安全模組 XecGuard。這項技術採用專屬多階段調校技術(SFT+GRPO),能以「直接安裝」的方式為 AI 系統提供資安防護,確保企業在推動在地化應用時,能有效抵禦惡意攻擊。
在技術實測方面,研發團隊以 Twinkle AI 聯合開發的 3B 規模開源模型 F1 (Formosa-1) 作為測試基礎,經 LLM Red Teaming 攻防驗證,展現卓越的防禦力:
防禦效能顯著精進:整體安全防禦分數平均提升 19.4%,在特定攻擊場景下,提升幅度更達 33.9%。
超越國際級模型:F1 搭配 XecGuard 後的防護表現,已顯著超越 Llama 3B、Gemma3 4B 及 DeepSeek 8B 等多款國際商業級模型。
精準對抗關鍵攻擊:能有效抵禦提示詞注入 (Prompt Injection) 與提示詞竊取 (Prompt Extraction) 等威脅,同時在執行核心任務時維持高品質的回應能力。

2025-07-02
防範提示詞攻擊!奧義智慧攜APMIC推AI模型XecGuard 實測防護力超越Llama、DeepSeek

2025-07-01
APMIC與奧義智慧攜手推出XecGuard 打造業界首款防禦導向AI安全模組 | ICT趨勢 | 商情 | 經濟日報

2025.04 | 發表 Formosa-1 繁中模型與 Twinkle Eval 評測框架

Twinkle AI 與 APMIC 合作推出台灣首款可於行動裝置執行的 3B 參數推理模型「Formosa-1」。該模型採用模型蒸餾技術(Distillation)並整合台灣在地思維鏈(TCoT)資料,顯著精進了模型在法律推理與邏輯思辨上的表現。同步釋出的開源評測框架 Twinkle Eval,則透過大規模並行測試與隨機化機制,確保模型在在地指標(如 TMMLU+ 與法律測試集)下的穩定性,為繁體中文 AI 開發提供更公平且精確的評估標準。

2025-04-29
APMIC 3B語言模型 「Formosa-1」整合MCP協議,台灣首款能在手機運行的開源3B參數繁體中文語言模型 | T客邦

2025-04-08
APMIC 攜手 Twinkle AI 推手機3B 繁中模型「Formosa-1」 | 產業熱點 | 產業 | 經濟日報

2025-04-08
APMIC攜手Twinkle AI推出可在手機端執行的台灣在地化繁中推論模型Formosa-1,同時推出推論模型測試工具Twinkle Eval #蒸餾 (238396) - Cool3c

2025-04-08
首個手機可執行的繁體中文推理模型「Formosa-1」發表 採 30 億組參數規格 #APMIC (238415) - Cool3c


類似這樣的功能
媒體專區 | 忠泰美術館

新聞內頁與素材區設計架構

  1. 頁面頂端:報導核心 (The Lead)
    標題: 使用有力且具專業感的標題(如:Twinkle AI 榮獲 2025 IT Matters 開源社群貢獻獎)。
    日期與類別: 標註發表日期。
    內容正文: 包含我們之前整理的新聞簡介、技術細節(如 GRPO 調校或 TCoT 思維鏈)以及群主或專案負責人的話。
  2. 頁面尾端:媒體資源區 (Press Resources Area)
    使用水平分割線 --- 與正文區隔,並設計一個簡潔的下載區塊:
    📥 媒體資源與素材下載 (Press Kit)
    為了方便媒體朋友報導與引用,我們提供了本篇新聞相關的高解析度素材。所有檔案均採用 CC BY 4.0 授權使用。
    新聞稿下載 (Press Release)
    [繁體中文版 - PDF] | [英文版 - PDF]
    高解析度圖片 (High-Res Images)
    獲獎照片:IT Matters Awards 獎盃與現場側拍。
    技術成果:模型在行動裝置執行的介面截圖。
    社群活動:週年聚會超過 70 人參與的盛況照片。
    社群識別系統 (Brand Identity)
    Twinkle AI 官方標誌 (SVG / PNG)。

Metadata

Metadata

Assignees

Labels

enhancementNew feature or request
No fields configured for Feature.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions