LLM:Large Language Model(大規模言語モデル)

提供: 作業療法大百科事典OtWiki

たくさんの言葉を学習したAI。見た目、人間ほど賢い。

概要

大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータを使ってトレーニングされた自然言語処理のモデルのことである。[1]

注目すべきLLM

Snowflake Arctic[2]

実用化

大体のAIサービスはLLMを用いたものになっている。

ChatGPT

OpenChat 大規模言語モデル(LLM)の利用を簡素化するオープンソースのチャットbotコンソール

OpenCopilot 企業がSaaSやWebアプリケーションなどの製品で、ユーザーを支援するカスタムAI(人工知能)コパイロットを提供するためのOSS(オープンソースソフトウェア)[3]

日本語大規模モデル

日本語大規模言語モデル「Japanese Stable LM 3B-4E1T」「Japanese Stable LM Gamma 7B」を公開しました — Stability AI Japan

ローカルLLM

ELYZA[4]

僅か2.3GBで日本語可能な超高性能ローカルLLMのPhi-3 MINIをllama.cppとCPUで動かしてみた。スマホでも可。従来のコンパクトLLMと比較して超越した性能で未来を感じさせるMicroSoft寄付ありがとう - Togetter

【令和最新版】何もわからない人向けのローカル LLM 入門

LLMプロダクト開発とはどういうものなのか?|erukiti

[1]

資料

LLM勉強会

参照