大規模言語モデル
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
] [
Twitter
]
開始行:
→自然言語処理
→OpenAIのAPI
#contents
*サブトピック [#t3278c3a]
-LLM一般
--Amazon Bedrock
-LLMアプリ開発
-LLMのローカル知識対応
--RAG関連
-プロンプト・エンジニアリング
-GPT関連
--Transformer
-LLMライブラリ
-LLMの歴史
*Command R+ [#ybea5678]
-[[Command R+はどこまで量子化するとアホになってしまうのか...
--4bitまでは大して劣化しない
-[[Command R+はトークナイザーもすごかった #LLM - Qiita>ht...
-[[【Command R+】オープンソース界最強LLMがGPT-4レベルの性...
-[[OpenAIのライバル:Cohereが最高にイけている件 #LLM - Qii...
-[[日本語対応でGPT-4よりも高性能な大規模言語モデル「Comma...
*Claude [#ue4098b1]
→Amazon Bedrock
-[[VBA で Anthropic Claude 3 を使ってみよう #Excel - Qiit...
-[[【生成AI】Claude 3 OpusがAmazon Bedrockにやってきた! ...
-[[Claude 3最強のOpusがついにAWSのBedrockに来た!! #AWS ...
-[[GPT-4より賢いと言われる「Claude 3」でいろいろ試した - ...
-[[【ChatGPT超え?】最新AI「Claude 3」の恐るべき実力…本1...
-[[ASCII.jp:ChatGPTのライバル「Claude 3」の使い方 良い...
-[[ChatGPTはもう古い!?話題のClaude3を徹底解説>https://new...
-[[BedrockのClaude 3でストリーミング出力するシンプルなコ...
-[[Claudeがブラウジングできないので自作アプリをClaudeで作...
-[[Claude 3 Opusを試してみました - karaage. [からあげ]>ht...
-[[claude3を使ってみたら、ライティングの仕事が無くなるか...
-[[ChatGPTplusを解約してClaude3Proへ乗り換えをする際に検...
-[[【Amazon Bedrock】Claude 3 Haikuが利用可能になりました...
-[[Claude3にプロジェクト全体をぶち込むためのプロジェクト...
-[[Claude 3 Haiku の概要|npaka>https://note.com/npaka/n/...
-[[世界初?Claude3を使った動画解析 - claude3-video-analyz...
-[[Claude3を使って人間が読むようにパワポ資料を読み込んで...
--RAGかも
-[[anthropics/anthropic-tools>https://github.com/anthropi...
-[[Amazon Bedrock に Claude 3 が追加されたので試してみた ...
-[[BedrockのClaude3にマルチモーダルな問い合わせ可能なWeb...
-[[Anthropic Claude 3 Sonnet 使ってみた | DevelopersIO>ht...
-[[GPT-4よりすごいらしいClaude 3が気になったあなたへ #AWS...
-[[Anthropic Claude 3 の画像処理を試してみた | Developers...
-[[Claude 3を使ってさっそくローカルで画像解析してみた! #...
-[[Amazon BedrockでClaude 3 Sonnetが利用可能になりました ...
-[[Python ( Boto3 ) からBedrockのClaude3を実行する #Pytho...
-[[Google Colab で Claude 3 を試す|npaka>https://note.co...
-[[Claude 3 の概要|npaka>https://note.com/npaka/n/ncf17c...
-[[GPT-4を超えた? Claude 3が登場! Bedrockにも来ました。...
-[[君は Anthropic Claude を知っているか? #機械学習 - Qiit...
-[[ASCII.jp:ChatGPTとClaudeの違いは? チャットAI比較対決 ...
-[[ついに日本で利用可能になったChatGPTの強力ライバル「Cla...
-[[OpenAIの競合Anthropic、ChatGPTに匹敵するClaude2をリリ...
*1ビットLLM/BitNet [#a0bd94d0]
-[[生成AIでGPUがいらなくなる? 業界を揺るがす「1ビットLL...
-[[【論文丁寧解説】BitNet b1.58とは一体何者なのか #アルゴ...
-[[BitNetから始める量子化入門>https://zenn.dev/minux302/a...
-[[速報:話題の 1ビットLLMとは何か?|寺田英雄(?オープン...
-[[既存日本語LLMをBitNetで置き換えて実行してみた|はち>ht...
*Gemini [#pa886a46]
-[[「Gemini」とは?Googleの生成AIサービスの基本解説>https...
-[[Google Colab で Vertex AI の Gemini API を試す|npaka>...
-[[「Gemini」の政治理念は過度にリベラルに偏向?Googleは生...
-[[Google Colab で Gemma を試す|npaka>https://note.com/n...
-[[Googleが警告、AI「Gemini」に“機密情報を入力しないで”。...
-[[GoogleがGemini 1.5をリリース、最大100万トークンを処理...
-[[Geminiでマルチモーダル対応の生成AIチャットアプリを爆速...
-[[【Python】LangChainとGemini APIの革新的連携 | ジコログ...
-[[Gemini Proの動作検証が簡単にできるWebアプリのインスト...
-[[PythonでGemini APIを利用する方法 | ジコログ>https://se...
-[[Gemini API  |  Vertex AI  |  Googl...
-[[NodeからGemini APIを使ってみる | DevelopersIO>https://...
-[[Gemini Pro のリリースの概要|npaka>https://note.com/np...
-[[GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGP...
-[[電撃発表、グーグルが「全力開発」した生成AI「Gemini」の全貌...
-[[Googleが突如発表した新しいAI、Geminiがすごい - orangei...
*LlaMA [#kf4f3171]
-[[OpenAI Python APIライブラリーからllama-cpp-pythonで立...
-[[llama-cpp-pythonで、OpenAI API互換のサーバーを試す - C...
-[[llama2のpretrainingを試す>https://zenn.dev/if001/artic...
-[[Meta開発のLLMであるLLaMA、LLaMA2、派生モデルAlpacaにつ...
--LLaMAの基本アーキテクチャはTransformer
-[[【西川和久の不定期コラム】340億パラメータのLLMは手元の...
-[[えっ、まだChatGPT使ってんの? - Qiita>https://qiita.co...
-[[Metaの「Llama 2」をベースとした商用利用可能な日本語LLM...
-[[ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動か...
-[[Llama 2の性能がGPT-3.5並みだというのが本当かテストして...
-[[オープンソースで商用利用可能な大規模言語モデル「Llama ...
-[[話題のLlama 2という大規模言語モデルをAmazon SageMaker ...
**Llama.cpp [#l8243822]
-[[非力なパソコンでもLLMを動かしたい!? llama.cppの紹介 | ...
-[[Llama.cpp で Llama 2 を試す|npaka>https://note.com/np...
**Alpaca [#v7a594c5]
-LLaMAの派生モデル
-[[日本語Alpacaデータを用いてJapanese-Alapaca-LoRAを作っ...
-[[BloomをLoRaを使い日本語alpaca datasetでfine tuneを動か...
-[[チャットAI「Alpaca」をローカルにインストールしてオフラ...
-[[Alpaca-loraを日本語タスクでファインチューニングする - ...
-[[GitHub - antimatter15/alpaca-lora: Code for reproducin...
*rinna [#vcc7fc94]
-[[HuggingFaceのLLMのメモリ使用率を調べる #NLP - Qiita>ht...
-[[ローカルで動くマルチモーダルモデル(rinna-4b multimodal...
-[[ローカルでも動く!?日本語に特化した強化学習済み対話GP...
-[[上司「オンプレでチャットAI作って」 - Qiita>https://qii...
-[[ローカルで動く大規模言語モデル(Rinna-3.6B)を使ってあな...
-[[自分の過去ツイートでrinna/japanese-gpt-neox-3.6bをfine...
-[[話題のrinna-3.6bをColab無料枠で動かしたい!(Hugging Fa...
-[[【Python】手持ちのGPUがVRAM12Gだけど「Rinna-3.6B」とお...
-[[Google Colab で Rinna-3.6B を試す|npaka>https://note....
*PaLM [#eff95934]
-超大規模Transformerモデル、コーディングタスクや多言語タ...
-[[PaLM 2 APIを使ってtext-bisonモデルに感情分析させてみた...
-[[Googleは世界最大規模のAI言語モデル「PaLM」を開発、言葉...
*OpenCALM [#g26d0ca4]
-[[CyberAgent社の日本語LLM OpenCALMの対話モデル用途のfine...
-[[サイバーエージェントの日本語LLM OpenCALMをDatabricksで...
-[[CyberAgentの日本語言語モデルを試してみる - きしだのHat...
*Dolly [#p6852928]
-[[大規模言語モデル(LLM)Dollyをパラメーター数を変えて動か...
-[[LLMのオープンソース化とDatabricks - Speaker Deck>https...
-[[無料・商用利用可なオープンソースの大規模言語モデル Dol...
-[[Hello Dolly: オープンなモデルでChatGPTの魔法を民主化す...
*RWKV [#efdcce35]
-[[従来の大規模言語モデルの制約だった「入力量の限界」を取...
--アテンションの計算においては入力トークン間の全てのペア...
-[[RNNでTransformer並みの性能を実現するRWKVがやばい>https...
-[[RWKVをローカルPCで動かす(pyenv/Docker)>https://zenn....
-[[おうちの8GB VRAM GPUでChatRWKVと会話する - きしだのHat...
-[[Google Colab で RWKV を試す|npaka|note>https://note....
-[[ChatGPT終了のお知らせ!?完全無料&オープン爆速大規模自然...
*FlexGen [#d50e3855]
-[[LLM推論にGPUは1つでいい?FlexGenについてまとめてみた -...
-[[FlexGenでおうちのパソコンとお話する - きしだのHatena>h...
-[[ChatGPTで騒いでる場合じゃない。 AI研究者が「FlexGen」を...
-[[自宅で動くChatGPTと噂のFlexGenをDockerで手軽に動かす>h...
-[[大規模言語モデルをシングルGPUで動かせる!? FlexGenを触...
-[[ChatGPT級のAIチャットボットがすぐに使えるFlexGen(あな...
*その他のモデル [#kaf3dfd0]
-[[いちばんやさしいローカル LLM|ぬこぬこ>https://note.co...
--Ollama,quantkit
-[[賢いと噂の日本語LLM「ELYZA」をウェブAPIで使う! Power ...
-[[Google Colab で Xwin-LM-70B-V0.1-GPTQ を試す。|npaka>...
-[[100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデ...
終了行:
→自然言語処理
→OpenAIのAPI
#contents
*サブトピック [#t3278c3a]
-LLM一般
--Amazon Bedrock
-LLMアプリ開発
-LLMのローカル知識対応
--RAG関連
-プロンプト・エンジニアリング
-GPT関連
--Transformer
-LLMライブラリ
-LLMの歴史
*Command R+ [#ybea5678]
-[[Command R+はどこまで量子化するとアホになってしまうのか...
--4bitまでは大して劣化しない
-[[Command R+はトークナイザーもすごかった #LLM - Qiita>ht...
-[[【Command R+】オープンソース界最強LLMがGPT-4レベルの性...
-[[OpenAIのライバル:Cohereが最高にイけている件 #LLM - Qii...
-[[日本語対応でGPT-4よりも高性能な大規模言語モデル「Comma...
*Claude [#ue4098b1]
→Amazon Bedrock
-[[VBA で Anthropic Claude 3 を使ってみよう #Excel - Qiit...
-[[【生成AI】Claude 3 OpusがAmazon Bedrockにやってきた! ...
-[[Claude 3最強のOpusがついにAWSのBedrockに来た!! #AWS ...
-[[GPT-4より賢いと言われる「Claude 3」でいろいろ試した - ...
-[[【ChatGPT超え?】最新AI「Claude 3」の恐るべき実力…本1...
-[[ASCII.jp:ChatGPTのライバル「Claude 3」の使い方 良い...
-[[ChatGPTはもう古い!?話題のClaude3を徹底解説>https://new...
-[[BedrockのClaude 3でストリーミング出力するシンプルなコ...
-[[Claudeがブラウジングできないので自作アプリをClaudeで作...
-[[Claude 3 Opusを試してみました - karaage. [からあげ]>ht...
-[[claude3を使ってみたら、ライティングの仕事が無くなるか...
-[[ChatGPTplusを解約してClaude3Proへ乗り換えをする際に検...
-[[【Amazon Bedrock】Claude 3 Haikuが利用可能になりました...
-[[Claude3にプロジェクト全体をぶち込むためのプロジェクト...
-[[Claude 3 Haiku の概要|npaka>https://note.com/npaka/n/...
-[[世界初?Claude3を使った動画解析 - claude3-video-analyz...
-[[Claude3を使って人間が読むようにパワポ資料を読み込んで...
--RAGかも
-[[anthropics/anthropic-tools>https://github.com/anthropi...
-[[Amazon Bedrock に Claude 3 が追加されたので試してみた ...
-[[BedrockのClaude3にマルチモーダルな問い合わせ可能なWeb...
-[[Anthropic Claude 3 Sonnet 使ってみた | DevelopersIO>ht...
-[[GPT-4よりすごいらしいClaude 3が気になったあなたへ #AWS...
-[[Anthropic Claude 3 の画像処理を試してみた | Developers...
-[[Claude 3を使ってさっそくローカルで画像解析してみた! #...
-[[Amazon BedrockでClaude 3 Sonnetが利用可能になりました ...
-[[Python ( Boto3 ) からBedrockのClaude3を実行する #Pytho...
-[[Google Colab で Claude 3 を試す|npaka>https://note.co...
-[[Claude 3 の概要|npaka>https://note.com/npaka/n/ncf17c...
-[[GPT-4を超えた? Claude 3が登場! Bedrockにも来ました。...
-[[君は Anthropic Claude を知っているか? #機械学習 - Qiit...
-[[ASCII.jp:ChatGPTとClaudeの違いは? チャットAI比較対決 ...
-[[ついに日本で利用可能になったChatGPTの強力ライバル「Cla...
-[[OpenAIの競合Anthropic、ChatGPTに匹敵するClaude2をリリ...
*1ビットLLM/BitNet [#a0bd94d0]
-[[生成AIでGPUがいらなくなる? 業界を揺るがす「1ビットLL...
-[[【論文丁寧解説】BitNet b1.58とは一体何者なのか #アルゴ...
-[[BitNetから始める量子化入門>https://zenn.dev/minux302/a...
-[[速報:話題の 1ビットLLMとは何か?|寺田英雄(?オープン...
-[[既存日本語LLMをBitNetで置き換えて実行してみた|はち>ht...
*Gemini [#pa886a46]
-[[「Gemini」とは?Googleの生成AIサービスの基本解説>https...
-[[Google Colab で Vertex AI の Gemini API を試す|npaka>...
-[[「Gemini」の政治理念は過度にリベラルに偏向?Googleは生...
-[[Google Colab で Gemma を試す|npaka>https://note.com/n...
-[[Googleが警告、AI「Gemini」に“機密情報を入力しないで”。...
-[[GoogleがGemini 1.5をリリース、最大100万トークンを処理...
-[[Geminiでマルチモーダル対応の生成AIチャットアプリを爆速...
-[[【Python】LangChainとGemini APIの革新的連携 | ジコログ...
-[[Gemini Proの動作検証が簡単にできるWebアプリのインスト...
-[[PythonでGemini APIを利用する方法 | ジコログ>https://se...
-[[Gemini API  |  Vertex AI  |  Googl...
-[[NodeからGemini APIを使ってみる | DevelopersIO>https://...
-[[Gemini Pro のリリースの概要|npaka>https://note.com/np...
-[[GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGP...
-[[電撃発表、グーグルが「全力開発」した生成AI「Gemini」の全貌...
-[[Googleが突如発表した新しいAI、Geminiがすごい - orangei...
*LlaMA [#kf4f3171]
-[[OpenAI Python APIライブラリーからllama-cpp-pythonで立...
-[[llama-cpp-pythonで、OpenAI API互換のサーバーを試す - C...
-[[llama2のpretrainingを試す>https://zenn.dev/if001/artic...
-[[Meta開発のLLMであるLLaMA、LLaMA2、派生モデルAlpacaにつ...
--LLaMAの基本アーキテクチャはTransformer
-[[【西川和久の不定期コラム】340億パラメータのLLMは手元の...
-[[えっ、まだChatGPT使ってんの? - Qiita>https://qiita.co...
-[[Metaの「Llama 2」をベースとした商用利用可能な日本語LLM...
-[[ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動か...
-[[Llama 2の性能がGPT-3.5並みだというのが本当かテストして...
-[[オープンソースで商用利用可能な大規模言語モデル「Llama ...
-[[話題のLlama 2という大規模言語モデルをAmazon SageMaker ...
**Llama.cpp [#l8243822]
-[[非力なパソコンでもLLMを動かしたい!? llama.cppの紹介 | ...
-[[Llama.cpp で Llama 2 を試す|npaka>https://note.com/np...
**Alpaca [#v7a594c5]
-LLaMAの派生モデル
-[[日本語Alpacaデータを用いてJapanese-Alapaca-LoRAを作っ...
-[[BloomをLoRaを使い日本語alpaca datasetでfine tuneを動か...
-[[チャットAI「Alpaca」をローカルにインストールしてオフラ...
-[[Alpaca-loraを日本語タスクでファインチューニングする - ...
-[[GitHub - antimatter15/alpaca-lora: Code for reproducin...
*rinna [#vcc7fc94]
-[[HuggingFaceのLLMのメモリ使用率を調べる #NLP - Qiita>ht...
-[[ローカルで動くマルチモーダルモデル(rinna-4b multimodal...
-[[ローカルでも動く!?日本語に特化した強化学習済み対話GP...
-[[上司「オンプレでチャットAI作って」 - Qiita>https://qii...
-[[ローカルで動く大規模言語モデル(Rinna-3.6B)を使ってあな...
-[[自分の過去ツイートでrinna/japanese-gpt-neox-3.6bをfine...
-[[話題のrinna-3.6bをColab無料枠で動かしたい!(Hugging Fa...
-[[【Python】手持ちのGPUがVRAM12Gだけど「Rinna-3.6B」とお...
-[[Google Colab で Rinna-3.6B を試す|npaka>https://note....
*PaLM [#eff95934]
-超大規模Transformerモデル、コーディングタスクや多言語タ...
-[[PaLM 2 APIを使ってtext-bisonモデルに感情分析させてみた...
-[[Googleは世界最大規模のAI言語モデル「PaLM」を開発、言葉...
*OpenCALM [#g26d0ca4]
-[[CyberAgent社の日本語LLM OpenCALMの対話モデル用途のfine...
-[[サイバーエージェントの日本語LLM OpenCALMをDatabricksで...
-[[CyberAgentの日本語言語モデルを試してみる - きしだのHat...
*Dolly [#p6852928]
-[[大規模言語モデル(LLM)Dollyをパラメーター数を変えて動か...
-[[LLMのオープンソース化とDatabricks - Speaker Deck>https...
-[[無料・商用利用可なオープンソースの大規模言語モデル Dol...
-[[Hello Dolly: オープンなモデルでChatGPTの魔法を民主化す...
*RWKV [#efdcce35]
-[[従来の大規模言語モデルの制約だった「入力量の限界」を取...
--アテンションの計算においては入力トークン間の全てのペア...
-[[RNNでTransformer並みの性能を実現するRWKVがやばい>https...
-[[RWKVをローカルPCで動かす(pyenv/Docker)>https://zenn....
-[[おうちの8GB VRAM GPUでChatRWKVと会話する - きしだのHat...
-[[Google Colab で RWKV を試す|npaka|note>https://note....
-[[ChatGPT終了のお知らせ!?完全無料&オープン爆速大規模自然...
*FlexGen [#d50e3855]
-[[LLM推論にGPUは1つでいい?FlexGenについてまとめてみた -...
-[[FlexGenでおうちのパソコンとお話する - きしだのHatena>h...
-[[ChatGPTで騒いでる場合じゃない。 AI研究者が「FlexGen」を...
-[[自宅で動くChatGPTと噂のFlexGenをDockerで手軽に動かす>h...
-[[大規模言語モデルをシングルGPUで動かせる!? FlexGenを触...
-[[ChatGPT級のAIチャットボットがすぐに使えるFlexGen(あな...
*その他のモデル [#kaf3dfd0]
-[[いちばんやさしいローカル LLM|ぬこぬこ>https://note.co...
--Ollama,quantkit
-[[賢いと噂の日本語LLM「ELYZA」をウェブAPIで使う! Power ...
-[[Google Colab で Xwin-LM-70B-V0.1-GPTQ を試す。|npaka>...
-[[100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデ...
ページ名: