由長春集團、和碩聯合科技、長庚醫院、欣興電子、科技報橘聯合發起,與台大資工系、台大資管系及律果科技合作,在 NVIDIA 支持下訓練的「繁體中文專家模型開源專案 TAiwan Mixture of Experts(後簡稱 Project TAME )」,在 7/1 正式發表,全球首創重量級多產業共同孕育的繁中大型語言專家模型正式亮相,是唯一擁有產業專業知識的開源模型,能以在地化文化及用語,協助台灣產業快速導入生成式AI落地應用。舉例來說,一般企業如果要從零開始訓練10億參數模型,約需耗資台幣3.8億及耗時576小時,但基於Project TAME700億參數模型,企業導入只需台幣1,600萬的成本、且短短3.5小時(模型迭代一次)就能訓練企業內部資料,大幅降低導入成本及時間,快速優化企業在運營管理、人員訓練、產品服務、客服等多元AI應用,Project TAME 接下來將以 Open Model開源模型形式,拋磚引玉、邀請產業一同加入、共創「台灣產業專用 AI 應用生態系」。
這次 Project TAME 繁中專家模型開源計畫,由台大資工系副教授陳縕儂帶領實驗室同仁與企業夥伴開發團隊共同合作,使用 NVIDIA 開發者計畫技術支持,讓多家垂直產業的企業專家貢獻專業領域的資料,預訓練近 5 千億個字(token)開發出繁中大型語言專家模型。包括長春集團、和碩聯合科技、欣興電子、長庚醫院、科技報橘、律果科技即為石化工業、電子製造、醫療服務、內容服務、法律等各產業代表,成為首批聯合投入 Project TAME 繁體中文模型訓練的業界專家角色。
在完全沒有簽約的約束下,業界跟學界紛紛自發性合作,短短數月推動下,Project TAME 繁體中文模型已有初步具體顯著成果,在各項繁中相關指標中領先全球模型,連台灣的「大學學測、律師/中醫考試、導遊證照、駕照、台灣在地化測驗」都分數優異,在台39項綜合評測,近三千個題目,Project TAME 分數就超過所有模型,正確率相較第二名的Claude-Opus模型高了 6.8%,比 GPT-4o 甚至高了 9.3%。
長春集團(大連)董事長林顯東談到決定參與 Project TAME ,在於他觀察到中國石化業正以前所未有的速度擴張,台灣可能花三十年才能推進 100 萬噸的產能,中國在兩三年間就直接超車達到 200 萬噸,因此長春集團更需要懂得應用 AI 預測分析,更快得知獲利、產品競爭上可能出現的風險。林顯東指出,長春集團的 AI 藍圖為建立涵蓋企業五大機能「產銷人發財」的戰情分析室。
和碩聯合科技在設計到系統化生產製造服務相關的開發技術上,積極嘗試 AI 的可能性以及 發展 AI 製造應用。和碩聯合科技參與 Project TAME,目的是希望透過開放式聯盟的創新合作方式,結合各產業領域的專家資料,以及學界大型語言模型的專業,加速產業生成式AI的應用,實現AI落地的場景。
長庚醫院藉由參與 Project TAME,啟動 AI 輔助醫療與照護的新紀元。林口長庚醫院院長陳建宗表示,將 AI 繁中大型語言模型導入醫療第一線,醫師只要在病歷上搜尋資料,就會彈出視窗顯示,以前沒有那麼方便,現在整合所有資料,又符合醫師作業習慣。
欣興電子參與 Project TAME,除了合作建立公開的繁體中文專家模型,也將透過公司內部資料庫,調校成內部專用的產業專家模型,預期在未來可為專業知識問答,提供更符合公司內部作法的準確建議,提升工作效率。
科技報橘意識到內容生成必定會劇烈改變內容產業的生態,目前大型語言模型已經被證明在內容創作、研究分析情報和個人化等範疇有具體的進展。科技報橘已使用未經過繁中優化的大型語言模型推出測試的內容產製,在官網上的 AI 人機協作專區已可看到,但這一年的實驗顯示,勢必需要有繁中優化的大型語言模型才能更好服務社群用戶。
法律科技新創公司律果科技表示,法律內容有很強的在地化需求,因此協助 Project TAME 加入台灣法律語料進行訓練。台大資工系將目前各大型語言模型試用在台灣律師考試題目上,Project TAME 分數均超過所有其他模型。
繁體中文專家模型 Project TAME 正式對外發布後,將採用 Open Source 開放原始碼的形式,讓各產業企業有一個 Hub 中心可以進行合作。台大資工系副教授陳縕儂指出,在不同的資料間可能有共同交集可以使用, 這對語言模型的發展是更好的,也能讓不同產業的專家貢獻自己領域的資料。目前已開放各企業皆可免費下載使用「繁體中文專家模型 Project TAME」、模型聊天頁面、以及由亞太智能機器(APMIC)率先整合 Project TAME,提供聊天機器人測試頁。