大規模言語モデル
https://www.sangyo-rock.com/tech/index.php?%C2%E7%B5%AC%CC%CF%B8%C0%B8%EC%A5%E2%A5%C7%A5%EB
[
トップ
] [
編集
|
凍結
|
差分
|
履歴
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
] [
Twitter
]
→
自然言語処理
→
OpenAIのAPI
サブトピック
DeepSeek
Cohere Command R+
1ビットLLM/BitNet
その他のモデル
サブトピック
†
LLM一般
Amazon Bedrock
LLMアプリ開発
ノーコード系のAI活用
AIエージェント開発
LLMのローカル知識対応
RAG関連
Claude関連
OpenAI関連
Gemini関連
(元Bard)
Llama関連
マイナー系LLM
rinna,OpenCALM,Dolly,RWKV,FlexGen
Transformer
GPT関連
LLMライブラリ
LLMの歴史
プロンプト・エンジニアリング
↑
DeepSeek
†
Not蒸留物、本物のDeepSeek-R1(671B)を1.58bit量子化したモデルを動かす(1500円/時)
2025.2
DeepSeek-R1 models now available on AWS | AWS News Blog
2025.2
Amazon Bedrock
Marketplace および Amazon SageMaker JumpStart で一般提供
DeepSeek-R1の技術的詳細
2025.2
「DeepSeek-R1は厳格なレッドチームテストと安全性評価を受けている」Microsoftが公式ブログにて言及 - 窓の杜
2025.1
DeepSeek-R1がオープンソースでなければならなかった理由、そしてなぜOpenAIを倒せないのか - GIGAZINE
2025.1
DeepSeek推しのローカルLLM勢から見るDeepSeek|Holy_fox
2025.1
DeepSeek R1 Dynamic 1.58-bit の概要|npaka
2025.1
Amazon Bedrockのカスタムモデルインポートで DeepSeek-R1を触ってみた #AWS - Qiita
2025.1
DeepSeek-R1 1.58bを試す/ついに実用的なBitNetが!?|shi3z
2025.1
DeepSeek R1が何故OSSとして発表されたか - サッとぶ
2025.1
DeepSeekの成功は必然。ビッグテックがやりたくないことをやった | ギズモード・ジャパン
2025.1
金ではなく時間と手間をかけた
Ollamaを活用したDeepSeek-R1のローカルLLM構築ガイド - GPT Master
2025.1
DeepSeek-R1がNPU上で動作できるようMicrosoftが移植 - PC Watch
2025.1
DeepSeek狂奏曲 – WirelessWire News
2025.1
【蒸留モデル】DeepSeek-R1ローカル実行時におすすめのモデル #macOS - Qiita
2025.1
話題の「DeepSeek-R1(の派生モデル)」はAmazon Bedrockで利用可能だよ〜〜!!!だがしかし #AWS - Qiita
2025.1
中華製AI「DeepSeek」はNVIDIAを駆逐するか 無料で性能はChatGPTにほぼ引けを取らない | 生成AI第2幕の行方 | 東洋経済オンライン
2025.1
性能はChatGPTよりも上…無料の中国製AI「DeepSeek」がヤバすぎる!東大の入試問題を解かせてわかった「驚異の実力」(現代ビジネス) - Yahoo!ニュース
2025.1
“OpenAIを脅かす”中国発の新AIモデル「DeepSeek R1」無料で使える魅力と要注意ポイントとは(オタク総研) - Yahoo!ニュース
2025.1
ASCII.jp:ChatGPT超えの中国AI「DeepSeek-R1」の衝撃
2025.1
DeepSeek-R1の論文読んだ?【勉強になるよ】
2025.1
DeepSeek検索:高性能LLMによる効率的なエビデンス収集|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
2025.1
GitHub - Jiayi-Pan/TinyZero
2025.1
DeepSeek-R1 の technical report を読んでみた
2025.1
DeepSeek R1 完全ガイド:o1並みの推論モデルがまさかのオープンソース&激安APIで新登場 | AIじゃないよ
2025.1
DeepSeek-R1 の概要|npaka
2025.1
DeepseekV3は何がすごいのか?何故ヤバいと言われているのかを解説
2025.1
deepseek-ai/DeepSeek-V3
↑
Cohere Command R+
†
ASCII.jp:まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
2024.5
Amazon BedrockでCohere Commandのプロンプトの奥地に迫る #AWS - Qiita
2024.5
Cohere Command R+ のクエリの書き換え機能を確認する #AWS - Qiita
2024.5
Cohere の Command R/R+ において 128k input tokens は短いのか長いのか #bedrock - Qiita
2024.4
Command R+はどこまで量子化するとアホになってしまうのか? – soy-software
2024.4
4bitまでは大して劣化しない
Command R+はトークナイザーもすごかった #LLM - Qiita
2024.4
【Command R+】オープンソース界最強LLMがGPT-4レベルの性能を達成 | WEEL
2024.4
OpenAIのライバル:Cohereが最高にイけている件 #LLM - Qiita
2024.4
日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能 - GIGAZINE
2024.4
↑
1ビットLLM/BitNet
†
1(.58)ビット量子化LLMs(BitNet b1.58)について|はまち
2024
生成AIでGPUがいらなくなる? 業界を揺るがす「1ビットLLM」とは何か、識者に聞いた(1/3 ページ) - ITmedia AI+
2024.4
【論文丁寧解説】BitNet b1.58とは一体何者なのか #アルゴリズム - Qiita
2024.3
BitNetから始める量子化入門
2024.3
速報:話題の 1ビットLLMとは何か?|寺田英雄(?オープンストリームCTO)
2023.3
既存日本語LLMをBitNetで置き換えて実行してみた|はち
2023.3
↑
その他のモデル
†
新手法「TAID」を用いた小規模日本語言語モデル「TinySwallow-1.5B」の公開
2025.1
J-Moshi
2025.1
完全にオープンな約1,720億パラメータ(GPT-3級)の大規模言語モデル 「llm-jp-3-172b-instruct3」を一般公開〜GPT-3.5を超える性能を達成〜 - 国立情報学研究所 / National Institute of Informatics
2024.12
Transformer を ONNX 形式に変換するのに苦労した話 - Inside of LOVOT
2024.12
LLM用のデータセットを作ってみる - 地平線まで行ってくる。
2024.9
Tanuki-8B
【これがゲームチェンジャーか!】松尾研のTanuki-8BとTanuki-8x8Bを試す|shi3z
2024.8
LLM 勉強会 - LLM 勉強会
2024.6
X(旧Twitter)に「Grok」が搭載! イーロン・マスク氏が設立したxAI社の生成AI - 窓の杜
2024.5
いちばんやさしいローカル LLM|ぬこぬこ
2024.4
Ollama,quantkit
ObsidianとELYZAの言語モデルを使って手軽に実現するローカルLLM活用 #ELYZA-japanese-Llama-2-7b - Qiita
2024.6
賢いと噂の日本語LLM「ELYZA」をウェブAPIで使う! Power Automateなどからも呼び出せる完全ローカル環境の構築【イニシャルB】 - INTERNET Watch
2023.10
Google Colab で Xwin-LM-70B-V0.1-GPTQ を試す。|npaka
2023.9
100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデル“Weblab-10B”をオープンソースで公開しました。 – 東京大学松尾研究室 – Matsuo Lab
2023.8
最新の50件
2025-02-09
スケジュール・進捗管理
AIエージェント開発
モダンJSフレームワーク一般
AIエージェントによる開発支援
認証技術
GitHub Copilot一般
GitHub Copilot
Node.js関連
AI/機械学習
パスワードレス認証
様々なプログラム言語
2025-02-08
RAG関連
LangChainによるRAG
LangChain関連
LangGraph関連
音声処理関連
IaC(Infrastructure as Code)
Webブラウザ
ノーコード系のAI活用
Visual Studio Code
2025-02-07
Java一般
AWSによるRAG開発
入力機器
2025-02-06
スクレイピング
IT業界とブラック企業
AIによる失業
職業としてのエンジニア
2025-02-05
生成AIと社会・法律・著作権
画像認識/検出/トラッキング
データ分析
2025-02-04
OpenAI関連
AWS EC2
勉強法など
生成AI
Python文法系Tips
自動化系エージェント
自動化
OpenAI一般
IT業界の人事関連
2025-02-03
Webサーバ
Git関連
エンジニアの健康
iPhone関連
2025-02-02
JavaのWebアプリ開発
読み物
Windows11関連
Office関連メモ
2025-02-01
大規模言語モデル
CPU関連
開発チームの構築
添付ファイル:
LLM系統.jpg
252件
[
詳細
]
Last-modified: 2025-02-01 (土) 21:31:37
Link:
AIエージェント開発
AIエージェントによる開発支援
AI/機械学習
RAG関連
ノーコード系のAI活用
AWSによるRAG開発
OpenAI関連
生成AI
LLM一般
自然言語処理
技術情報Wiki
プロンプト・エンジニアリング
OpenAIのAPI
LLMライブラリ
GPT関連
Claude関連
Transformer理論的説明
Gemini関連
マイナー系LLM
Llama関連
Amazon Bedrock
LLMアプリ開発
LLMの歴史
LLMのローカル知識対応
Transformer