「LLM:Large Language Model(大規模言語モデル)」の版間の差分
提供: 作業療法大百科事典OtWiki
(同じ利用者による、間の5版が非表示) | |||
4行目: | 4行目: | ||
大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータを使ってトレーニングされた自然言語処理のモデルのことである。<ref>https://atmarkit.itmedia.co.jp/ait/spv/2303/13/news013.html</ref> | 大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータを使ってトレーニングされた自然言語処理のモデルのことである。<ref>https://atmarkit.itmedia.co.jp/ait/spv/2303/13/news013.html</ref> | ||
==注目すべきLLM== | |||
Snowflake Arctic<ref>[https://gigazine.net/news/20240426-arctic-open-efficient-foundation-language-models-snowflake/ 無料で商用利用可能なSQL生成・コーディング・命令フォローなどのエンタープライズタスクに最適化された大規模言語モデル「Snowflake Arctic」が登場 - GIGAZINE]</ref> | |||
==実用化== | ==実用化== | ||
大体のAIサービスはLLMを用いたものになっている。 | 大体のAIサービスはLLMを用いたものになっている。 | ||
[[ChatGPT]] | |||
OpenChat 大規模言語モデル(LLM)の利用を簡素化するオープンソースのチャットbotコンソール | OpenChat 大規模言語モデル(LLM)の利用を簡素化するオープンソースのチャットbotコンソール | ||
18行目: | 24行目: | ||
===ローカルLLM=== | ===ローカルLLM=== | ||
[https://elyza.ai/ ELYZA]<ref>[https://note.com/en2enzo/n/n121f72756e58 【無料】ローカルPCで動く日本語LLM(ELYZA-japanese-Llama-2-7b-instruct)|えんぞう]</ref> | |||
[https://togetter.com/li/2355369 僅か2.3GBで日本語可能な超高性能ローカルLLMのPhi-3 MINIをllama.cppとCPUで動かしてみた。スマホでも可。従来のコンパクトLLMと比較して超越した性能で未来を感じさせるMicroSoft寄付ありがとう - Togetter] | |||
[https://zenn.dev/saldra/articles/201dd9e7d8c743 【令和最新版】何もわからない人向けのローカル LLM 入門] | [https://zenn.dev/saldra/articles/201dd9e7d8c743 【令和最新版】何もわからない人向けのローカル LLM 入門] | ||
[https://note.com/erukiti/n/ne901fbb08145 LLMプロダクト開発とはどういうものなのか?|erukiti] | |||
[https://zenn.dev/shu223/articles/localllm-ios ] | |||
==資料== | ==資料== |
2024年4月26日 (金) 22:01時点における版
たくさんの言葉を学習したAI。見た目、人間ほど賢い。
概要
大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータを使ってトレーニングされた自然言語処理のモデルのことである。[1]
注目すべきLLM
Snowflake Arctic[2]
実用化
大体のAIサービスはLLMを用いたものになっている。
OpenChat 大規模言語モデル(LLM)の利用を簡素化するオープンソースのチャットbotコンソール
OpenCopilot 企業がSaaSやWebアプリケーションなどの製品で、ユーザーを支援するカスタムAI(人工知能)コパイロットを提供するためのOSS(オープンソースソフトウェア)[3]
日本語大規模モデル
日本語大規模言語モデル「Japanese Stable LM 3B-4E1T」「Japanese Stable LM Gamma 7B」を公開しました — Stability AI Japan
ローカルLLM
LLMプロダクト開発とはどういうものなのか?|erukiti