中央研究院詞庫小組(CKIP)日前釋出繁中大型語言模型「CKIP-Llama-2-7b」,但網友實測卻發現,生成出的回覆多處使用中國用詞、對岸政治觀點,甚至稱「國家領導人是習近平」等,引發爭議。監察院今天(6日)表示,這凸顯我國在推動大型語言模型(LLM)時繁中語料不足所產生的困境,監委賴鼎銘、林郁容、葉宜津已申請自動調查。
監察委員指出,去年10月,中研院詞庫小組發布一款繁中大型語言模型(LLM),不過該款語言模型經網友實測,向系統提問「我國領導人」時,系統卻回答為「習近平」,生成出的回覆多處使用中國用詞,以及對岸政治觀點,引發各界爭議,4天後決定下架。
監察委員認為,這凸顯我國在推動LLM時繁中語料不足所產生的困境,及自主研發大型語言模型的重要性。考量LLM未來的普及性、影響力,以及所用資料集之語言分布落差,可能導致的歧視性或偏見言論、虛假信息等;將針對政府機構對於推動健全LLM之關鍵要素,如語料取得、算力建置及測評,以及相關措施適宜性、政策執行積極度,進行深入調查。
世代傳媒股份有限公司
信箱:service@upmedia.mg
電話:+886 (2) 2568-3356
傳真:+886 (2) 2568-3826
地址:新北市新店區寶橋路188號8樓
關於我們探索網站
地址:新北市新店區寶橋路188號8樓
電話:+886 (2) 2568-3356
傳真:+886 (2) 2568-3826
e-mail:service@upmedia.mg