大規模言語モデル– tag –
-
サイエンス
AIは宇宙について何を学べるのか?
人工知能と機械学習は、データ分析、サイバーセキュリティ、医薬品開発、作曲、芸術的レンダリングなど、幅広い用途でユビキタスになっている。近年、大規模言語モデル(LLM)も登場し、人間との対話と文章作成がアプリケーションの長いリストに加わった。... -
テクノロジー
OpenAI、経済紙「Financial Times」とコンテンツ使用を含む戦略提携を締結
大規模言語モデルのトレーニングデータの出処に関する議論はまだ続いているが、AI企業は報道機関との提携を続けており、その最新の動きとしてChatGPTの開発元であるOpenAIが、英国の経済紙「Financial Times」紙(FT)と戦略的提携を結んだことが発表された... -
テクノロジー
中国のAIスタートアップ「SenseTime」がGPT-4 Turbo超えのAIモデル「SenseNova 5.0」を発表
中国のAIスタートアップ「SenseTime」社は、マルチモーダル大規模言語モデル(LLM)の「SenseNova 5.0」を発表した。これまであまり名前を聞いたことのないこの企業は、今回ある主張によって一挙に注目を集めることとなった。それは、この新たなAIモデルが... -
テクノロジー
中国政府、AI開発のため高性能メモリ(HBM)の国内製造を目指し中国企業への支援を強化
The Informationの報道によると、Huaweiを中心とする中国チップメーカーのコンソーシアムは、2026年までにAIアプリケーション用の広帯域幅メモリ(High Bandwidth Memory: HBM)チップを製造することを目指しているとのことだ。 中国連合がHBMの製造を目指... -
テクノロジー
Apple、iPhone上で導入されると見られるオープンソースの軽量言語モデル「OpenELM」をリリース
Appleは本日新たなAIモデルを公開したが、この動きはこれまでの噂にあった、AppleのAI戦略が“オンデバイスでのAI処理”に軸足を置いた物であることを裏付ける物だ。 4つのオープンソースモデルの公開 Appleは、共同プラットフォームHugging Face上に、4つの... -
テクノロジー
OpenAIのGPT-4はセキュリティ勧告を読ませるだけで実際の脆弱性を自律的に攻撃することが出来た
GPT-4は、OpenAIによって作られた2024年4月初旬時点では最新のマルチモーダル大規模言語モデル(LLM)だ。この基盤モデル(Foundation Model)は、ChatGPTの有料サブスクリプションプラン「ChatGPT Plus」の顧客が主にアクセス可能だが、その高い能力は、... -
テクノロジー
MetaがAIアシスタント「Meta AI」をFacebook、Instagramなどに搭載、まずは米国など一部地域で展開開始
Metaは、本日最新の大規模言語モデル「Llama 3」を発表した事に伴い、同社のAIアシスタント「Meta AI」をLlama 3にアップグレードし、Facebook、Messenger、Instagram、WhatsAppの4つの主要なサービスの検索バーにおいて、Meta AIへのアクセス提供を開始し... -
テクノロジー
Meta、新たなオープン大規模言語モデル「Llama 3」をリリース、GoogleのGemini 1.5を上回る性能を発揮
Metaは、次世代大規模言語モデル(LLM)である「Llama 3」をリリースした。同社によれば、現在リリースされているほとんどのAIモデルよりも優れた性能を発揮するとしており、近いうちにマルチモダリティとより多くの言語をサポートする予定だという。 Meta... -
サイエンス
なぜロボットは文化的に鈍感なのか?そして研究者らはそれをどのようにして修正しているのか?
ロボットが寝室で英国の老人に話しかけている。ロボットは朗らかな態度で、心地よい甲高い声を出している。 ロボットは--おそらく男性の年齢のせいだろうが--男性に第二次世界大戦の思い出を尋ね始めた:「あなたとあなたの家族が経験しなければならなかっ... -
テクノロジー
Mistral AI、オープンソースLLM「Mixtral 8x22B」をリリース、他のオープンソースLLMを圧倒する性能
フランスのAIスタートアップMistral AIは、オープンソースにおいて、最高の性能と効率を達成したとする新型オープンソース言語モデル「Mixtral 8x22B」を発表した。 このモデルは、1,410億個のパラメーターのうち、390億個だけを積極的に使用するSMoE(Spa...