日本、独自の大規模言語モデル開発にスーパーコンピュータ「富岳」を活用。来年オープンソースで公開予定

サムネイル
1 : 2023/09/16(土) 06:29:14.44 ID:ta5f49yr0

日本政府とNEC、富士通、SoftBankといった大手テクノロジー企業は、“日本語に基づく”大規模言語モデルの開発に「数億ドル」を投資している。

彼らが開発しているこの新たな日本語モデルは、ChatGPTなどよりも文化的・言語的な微妙さを表現できるとされている。トレーニングは、日本が誇るスーパーコンピュータ「富嶽」を使って日本語のテキストで学習される予定だ。

LLMの日本文化に対する感受性を測定するため、研究者らはGPT-4で作成された質問を使って、LLMが日本特有の質問にどれだけ答えられるかを測定する「Rakuda Ranking」を開発した。現在、最も優秀な日本のオープンLLMは、このランキングで4位にランクされている。このランキングのトップはGPT-3.5であり、GPT-4はそれらをも大きく上回っている。

東京工業大学、東北大学、富士通、政府出資の理化学研究所によって開発されている日本語LLMは、来年オープンソースとして公開され、少なくとも300億のパラメータを持つ予定だ。

日本の文部科学省は、さらに大規模なモデルを構築している。少なくとも1,000億のパラメータを持つこのモデルもまた、日本語をベースとし、科学的応用のために最適化される予定だ:発表された研究に基づき、研究を加速させるための新たな仮説を生成する。このモデルの開発費は約2億ドルで、2031年に一般公開される予定である。

https://texal.jp/2023/09/16/japan-to-use-fugaku-to-develop-its-own-large-scale-language-model-to-be-released-as-open-source-next-year/

70 : 2023/09/16(土) 06:30:16.35 ID:HYCKz5ZA0
はい著作権
71 : 2023/09/16(土) 06:30:32.04 ID:Rd3M2Nfl0
著作物を無断学習してもええの?
72 : 2023/09/16(土) 06:31:34.92 ID:N1cGXJYD0
2031年っておっそ
その頃にはゲーム変わってそう
73 : 2023/09/16(土) 06:31:46.12 ID:MCdV/V3x0
結構先だな
75 : 2023/09/16(土) 06:36:23.77 ID:rloiAyo10
遅いしパラメータ数少ないな
76 : 2023/09/16(土) 06:37:49.52 ID:bAek3x6r0
ジャップランド語を廃止したらいいじゃん
77 : 2023/09/16(土) 06:37:50.32 ID:204kv7510
政府が関係するとどこにでもいるな、富士通
どんだけ巣食ってんだよ
78 : 2023/09/16(土) 06:39:54.34 ID:yk0xDYqM0
パイソンはもう古いの?
79 : 2023/09/16(土) 06:40:09.52 ID:2jya+mcQ0
GPUを大量に並べたほうが早いだろ
そんなに使い道ないのかよ
80 : 2023/09/16(土) 06:40:52.66 ID:834eH0e6a
300億円って舐めてるの?
オープンAIは13.4兆円を今後数年間の予算にしてるんだが
81 : 2023/09/16(土) 06:41:53.00 ID:M+U9uMwC0
日本語に基づく…
82 : 2023/09/16(土) 06:42:21.78 ID:B+MMWhsVa
そういう問題ではないw
83 : 2023/09/16(土) 06:42:48.71 ID:B+MMWhsVa
富岳って言っとけば日本人は騙されそうやなw

コメント

タイトルとURLをコピーしました