What are large language models?

Large language models are artificial intelligence systems that have been trained on vast data sets, often consisting of billions of words taken from books, the web, and other sources, to generate human-like, contextually relevant responses to queries. Because LLMs are designed to understand questions—or “prompts” in LLM terminology—and generate natural language responses, they can perform tasks such as answering customer questions, summarizing information in reports, translating between languages, and composing poetry, computer code, and first drafts of emails. LLMs typically have a sophisticated understanding of the grammar and semantics of the languages in which they’re trained. They can be configured to use an organization’s own data to provide responses that are unique to the organization.

How are large language models fine-tuned for specific applications?

LLMs are fine-tuned for specific applications by following the initial pretraining phase that employs self-learning to develop a foundation model with a supervised learning phase on a smaller amount of more domain-specific, labeled data.

What industries benefit most from using large language models?

Almost every industry is discovering the benefits of LLMs. Healthcare, financial services, and retail are among those exploring a variety of use cases around improving customer support and automating business processes.

Can large language models be integrated with enterprise systems?

Large language models are often integrated with enterprise systems by fine-tuning foundation models with enterprise data and augmenting those models with proprietary data through retrieval-augmented generation.

国/地域

大言語モデルとは

Joseph Tsidulko |シニア・ライター| 2025年7月29日

この記事の内容

大言語モデルとは
大規模言語モデルについての説明
LLMとその他のAIモデル：効率性とスケーラビリティ
大規模言語モデルのメリットと活用
小大規模言語モデルのユースケースと例
LLMの今後の展望
OCI Generative AIによるLLMアプリケーションの構築
LLMに関するFAQ

大規模言語モデル（LLM）は、テキストや音声など様々な手段で提供されるユーザー入力に対して、人間のような回答を生成することを主な目的として設計された人工知能の一種であり、近年ますます普及しています。大規模言語モデル（LLM）は大量のテキストでトレーニングするため、プロンプトを通じて提供される文脈に基づいて次の単語や単語列を予測できるようになります。さらに特定の著者やジャンルの文章スタイルを模倣することも可能です。

LLMは2020年代初頭に研究機関から急速に普及し、一般の認知を得ました。それ以来、リクエストを解釈し関連性のある回答を生成する優れた能力により、これらは独立した製品としてだけでなく、ビジネス・ソフトウェアに組み込まれた付加価値機能としても普及し、自然言語処理、機械翻訳、コンテンツ生成、チャットボット、文書要約などの機能を提供しています。

このテクノロジーは引き続き急速に進化を続けており、より大規模なデータセットを取り込み、モデルのパフォーマンス向上を図るためのトレーニングやチューニングのレイヤーを加えています。より広範かつ深いトレーニングは、ますます強力なコンピュート・インフラストラクチャによって実現され、組織目標を達成するための計画立案に活用できるますます高度な推論能力を生み出しています。これらの推論機能もまた、高度な大規模言語モデル（LLM）を用いて人間のオペレーターが設定したタスクを遂行するAIエージェントの機能を支えています。

大言語モデルとは

大規模言語モデルは、書籍やWeb、その他のソースから抽出された数十億語もの膨大なデータセットをもとにトレーニングされ、質問に対して人間のような状況に適した応答を生成する能力を持つAIシステムです。LLMは、質問（LLM用語では「プロンプト」）を理解し、自然言語で回答を生成するように設計されているため、顧客の質問への回答、レポート情報の要約、言語間の翻訳、詩やコンピュータコードの作成、メールの下書き作成などのタスクを実行できます。LLMは通常、トレーニングに使用された言語の文法とセマンティクスを深く理解しています。組織固有の自社データを活用するよう構成することで、その組織に特有の回答を返すことも可能です。

LLMは質問を理解するよう設計されていますが、こうした優れた機能がある一方、ユーザーはLLMの限界にも留意すべきです。古いデータや不明瞭なプロンプトは、チャットボットが企業の製品について誤った回答をするなど、誤りを引き起こす可能性があります。十分なデータが不足していると、LLMは実際に存在しない情報を作り出す（ハルシネーション）場合があります。LLMは予測に優れていますが、これまで特定の結論に至った過程の説明には不十分な面がありました。これらは、新しいLLMが改善を目指している分野の一部です。

それでもLLMは、自然言語処理分野において大きな進歩を遂げています。企業での用途は多岐にわたり、新規アプリケーションが迅速に開発・導入されています。

主なポイント

大規模言語モデルは自然言語処理分野における最先端技術であり、音声や画像を生成できるマルチモーダルAIの開発にも適用されています。
「大規模」とは相対的な表現であり、特定の入力に対して出力を決定する際、モデルが評価するパラメータの数を指します。
LLMは、2022年にOpenAIのGPT-3.5モデルを一般公開したアプリケーション「ChatGPT」のリリースにより、注目を集めました。その他の一般的なモデルには、Llama、Gemini、Cohere Command Rなどがあります。

大規模言語モデルについての説明

自然言語処理は1960年代から人工知能研究において活発に取り組まれてきた分野であり、初期の言語モデルは数十年前にさかのぼります。大規模言語モデルは、ニューラルネットワークに機械学習より高度なモデルを生成するディープラーニングを活用することで、この分野を飛躍的に発展させました。大規模言語モデル（LLM）のもう一つの特徴は、基盤モデルのトレーニングが、人間の介入を必要としないデータのラベリングという形で実施される点です。

現在のLLMの概念は、2017年にGoogleが発表した画期的な論文において、トランスフォーマー・ネットワークと呼ばれる強力な新アーキテクチャが紹介されたことで誕生しました。トランスフォーマーはセルフアテンション・メカニズムを駆使し、並列処理を可能にしたことで、モデルのトレーニングと導入の両方の速度向上とコスト削減を実現しました。OpenAIはこのアーキテクチャを適用し、多くの専門家が初の最新LLMと見なすGPT-1を開発しました。

企業はこれに注目し、LLMが数多くのユースケースを支え、ビジネスの生産性向上、効率化、顧客への迅速な対応を支援する膨大な可能性を提供していることへの認識を急速に深めています。

LLMとその他のAIモデル：効率性とスケーラビリティ

LLMは機械学習の過程で開発された数多くのAIモデルの一つです。ただし、これらのモデルを特徴づけ、際立たせる要素がいくつか存在します。最も大きな要素はその規模です。LLMにおける「大規模」とは、最終出力を計算するパラメータの数、およびそれらのパラメータを調整してモデルをトレーニングする際に投入されるデータの量を指します。

規模とパフォーマンス: LLMはモデルの規模によって定義され、この規模は出力結果を決定するパラメータ数を反映しています。主要なモデルはわずか数年で飛躍的に大規模化しました。GPT-1のパラメータ数は1億強でしたが、最新の後継モデルであるGPT-4は1.75兆を超えると推測されています（OpenAIは実際の規模を公表していません）。

通常、モデルの規模が大きく、その学習データセットが幅広いほど、人間の理解力や言語生成機能を巧みに模倣した、独自の適切な回答を生成する上で優れたパフォーマンスを発揮します。パフォーマンスはパープレクシティによって測定可能であり、これはモデルが出力シーケンスにおける次の単語を予測する際の確実性を定量化する指標です。

より大規模なモデルは通常、より高いパフォーマンスを発揮しますが、あらゆる面で優れているわけではありません。こうしたモデルに生じうる欠点としては、レイテンシ（プロンプトに対する回答生成に要する時間）の増加や、必要なコンピュート・インフラストラクチャによるスケーリングの困難さが挙げられます。また、特定の企業ユースケースに合わせてカスタマイズすることもより困難です。そのため、より限定された領域やユースケースにおいて、少なくとも十分なパフォーマンスを保ちつつ、導入コストを抑えた小型のLLMを開発する取り組みが注目されています。
スケーラビリティと導入: LLMはいくつかの異なる方法で導入できます。OpenAI、Google、Cohereなどの商用ベンダーは、ブラウザ、アプリケーション、またはAPIコールを通じてホストされたサービスとしてモデルを提供しています。しかしながら、多くの企業では、通常、ファインチューニングされた基盤モデル、あるいは独自のビジネスデータで拡張されたモデル、あるいはその両方を、ローカルサーバー、あるいはモデルの実行における推論フェーズを運用する自社のパブリック・クラウド環境でホストする方が好まれています。個人やソフトウェアは、直接呼び出しまたはAPIエンドポイントを通じてそれらとやりとりします。

導入方法にかかわらず、特に一般ユーザーや大規模な従業員がアクセス可能なLLMは、企業の予算を圧迫することなく、予測される需要を満たすための拡張性を備えている必要があります。このスケーリングの経済性にはトレードオフが伴います。スケーラビリティを向上させるための対策、例えばより強力な推論インフラストラクチャ、分散コンピューティング、効果的な負荷分散やキャッシュ技術などは、いずれもコストを伴います。コスト利益の適切バランスを欠くと、リアルタイムにアプリケーションを実行することができる機能を損なう遅延、パフォーマンスの不安定化、従業員による導入の遅れ、データ・プライバシーとセキュリティ対策の不備といった結果を招く可能性があります。
ドメインの適応性: 優れた基盤モデルは、ハイレベルで抽象的なデータを組み込み、出力において創造性を発揮することが可能です。適切なパワーと機能を持つ基盤モデルが選定された後、ファインチューニングにより専門のドメインやユースケースにおけるパフォーマンスをさらに向上させることが可能です。この教師あり学習フェーズでは、基本モデルを根本的に再トレーニングすることなく、LLMを目的のドメインに適応させます。

開発の初期トレーニング段階とファインチューニング段階の両方で、ドメイン間で共有される特徴を持つデータを強調することにより特徴分布を調整することも、ドメインの適応性を高める効果的な方法です。

この図は、大規模言語モデルが学習を行い、その後予測を行う仕組みを示しています。学習段階では、モデルはパターンを学習します。その後、推論段階に移行し、新しいデータを処理してインサイトや予測を生成します。

LLMとは、幅広い範囲で訓練されたニューラルネットワークを用いてプロンプトを評価し対応する、言語生成AIの一種です。「大規模」には明確な基準値が存在せず、その定義はモデルの高度化や処理能力の向上、特にGPUクラスタへのアクセスが普及するにつれて拡大し続けています。

トレーニング開始前には、言語がトークンに変換されます。トークンとは、アルファベットやスピーチの単語または部分をコンピューターが理解可能なかたちで数値化したものです。

次に、自己教師あり学習のために、幅広いコンピュータニューラルネットワークを含むアルゴリズムとデータセットが選択されます。トレーニング段階において、アルゴリズムは数十億から数兆ものパラメータを調整し、プロンプトに対してモデルが適切に回答するまで、シーケンス内の次のトークンを正確に予測します。したがって、モデルのパラメータにはトレーニング段階で得られた学習内容が蓄積されています。
コア・トランスフォーマー・アーキテクチャ：トランスフォーマーは、大規模言語モデル（LLM）と生成AIをめぐる現在の盛り上がりを導いた大きな概念的飛躍でした。2017年にGoogleの研究者らが画期的なレポートで提案したトランスフォーマー・アーキテクチャは、従来の言語モデル構築手法とは一線を画すものでした。入力と出力が連続的に処理される「再帰」と呼ばれるプロセスのみを用いる従来の方法とは異なり、トランスフォーマーは「セルフアテンション」と呼ばれるメカニズムを導入することで、文章を処理する際に、テキストの流れの中で遠く離れている単語同士も含め、複数の単語間の関係を同時に考慮します。これは、3種類の異なるベクトルを作成することで実現されます。1つは検討対象の単語、もう1つはその単語を理解する上で周囲の単語が持つ重要性を示すもの、そして3つ目はその単語が持つ情報を表すベクトルです。この第三のベクトルは、単語の文脈によって価値が異なります。「blue」は色を意味する場合もあれば、人の気分を示す場合、あるいは「突然思い浮かんだ」というように、突然のひらめきを意味する場合もあります。

たとえば、テキスト文字列は次のようになることがあります。
「気分はどうかしら」と彼女は尋ねました。

その回答として、彼は次のように答えました。「よくわからないよ。今日はどうしても仕事に集中できず、この状態がしばらく続いるんだよね。とても憂鬱だよ」

セルフアテンションがプロセスに組み込まれる前は、アルゴリズムが「feeling」と「blue」の関係性を捉える手段がなく、誤解釈が生じる可能性が高い状態にありました。セルフアテンションは、たとえ語順上近くにない単語同士であっても、両者の関連性の重要性を確立する手法を提供します。

さらに、セルフアテンションを使用することで、モデルは大量のデータを並列処理しながら学習することが可能なため、基本的に単語単位ではなく文単位で処理が行われます。これにより、GPUの機能をさらに活用できます。トランスフォーマーはまた、プロンプトからのトークンを同時に分析することで、より迅速に回答を提供し、曖昧さをより適切に解決することが可能です。
トレーニングおよびファインチューニング: 基盤モデルは、現在の主力となる大規模言語モデル（LLM）であり、インターネットやその他の文字情報リポジトリから収集されたデータコーパスを用いてトレーニングされます。数十億のパラメータが反復的に調整されるこの自己教師あり学習期間を経て構築された成功モデルは、一般的な出力（さまざまな文脈にわたるテキスト生成、異なる話し方の意味理解、複雑あるいは抽象的な概念の提示など）を生成することに優れている傾向があります。

基盤モデルは、医療や金融といった特定の分野、あるいは翻訳や要約といったユースケースにおいて、精度向上とパフォーマンス最適化のためにファインチューニングが可能です。ファインチューニング・プロセスは基盤モデルから始まり、その後、より小規模で精度の高いラベル付きデータセットを用いて最終的なLLMをさらにトレーニングし、特定の事業分野や用途に有用なタスクを処理する機能を向上させます。
モデルの重要性とスケーラビリティ：LLMの開発者は、最終的にアルゴリズムで訓練するパラメータの数と、効果的に訓練するために必要なデータ量を決定します。数値が大きいほど、得られるモデルは複雑になり、通常、出力の独自性、正確性、関連性が高まります。しかし、その優れたパフォーマンスには、レーニング・コストと運用コストの上昇が伴い、モデルのレーニング後により多くのユーザーにサービスを提供するためのスケーリングにおける課題も生じます。

LLMの導入におけるスケーラビリティの一部は、モデルの品質によって決まります。AI開発者が選択するトレーニング・アルゴリズム、モデル・アーキテクチャ、データセットは、基盤モデルがメモリ、プロセッサ、エネルギーなどのリソースをいかに効率的に消費し、意図した機能を実行するかに影響します。

また、モデルサイズとトレーニングデータのコーパスを削減する最先端の技術も登場しており、LLMのパフォーマンスに大きな影響を与えずに、特に限定的なユースケースでの利用において、スケーリングのコストと難易度を軽減します。

大規模言語モデルのメリットと活用

LLMは、多くの種類の最先端アプリケーションを支える元となる技術です。一般市民がLLMの驚異的な機能を広く知ることに繋がったきっかけは、OpenAIがブラウザベースで公開したGPT-3.5モデル、そしてGPT-4oやGPT-4といった最新バージョンであるChatGPTの登場でした。その利益は企業内にも全体にわたり広がり、金融サービス、人事、小売、マーケティング・営業、ソフトウェア開発、カスタマーサポート、医療など、さまざまな業界や事業部門においてLLMがその能力を発揮しています。

LMMの一般的なビジネス・アプリケーションには、カスタマーサービス用チャットボット、顧客感情分析、文脈に即した会話的で自然な翻訳サービスなどが挙げられます。またLMMは、製薬研究におけるタンパク質構造の予測、ソフトウェアコードの生成、企業がビジネス・プロセスの自動化に導入を拡大しているエージェントの強化など、より専門的なタスクを背後で実行しています。

アプリケーション横断的な汎用性：大規模言語モデル（LLM）は、多様化し増加を続ける消費者向けおよびエンタープライズ・アプリケーションを支えるコア・テクノロジーです。この多用途性は、大規模なデータセットを用いてモデルをセルフトレーニングするプロセスに由来しており、これによりデータ内の複雑なパターンを分析し、関連性のある文脈に沿った出力を生成する能力に極めて長けたAIが生まれます。

最先端のアプリケーションはこの特性を活用し、独自のマーケティング・コピーやレポートの作成、顧客感情の分析、文書の要約といったタスクを実行します。さらに、画像や音声など言語とは無関係な出力の生成さえも行います。AIエージェントは、特に、専門知識なしに環境とやりとりし、領域全体にわたりタスクを遂行する機能において、LLMの汎用性を実証しています。

教師あり学習によるモデルのファインチューニング・プロセスは、生成AIを基盤に構築可能な業務アプリケーションの範囲をさらに拡大します。また、RAGは、元となるモデルを変更することなく継続的に更新可能な独自のビジネスデータを組み込むことで、LLMの出力内容の正確性と関連性を向上させ、企業環境におけるLLMの効果を向上させることが可能です。
顧客とのやりとりの強化:LLMは、カスタマーサービスの領域において、その実力を迅速に実証しました。これは、LLMが明確で詳細かつ役立つ回答を次々と提供し、微妙なニュアンスを含む質問に対話形式で応答する機能を経験した誰にとってでも、明白なユースケースです。

ただし、LLMはチャットボットにとどまらず、さまざまな方法で顧客とのやりとりを向上させることが可能です。一部の企業では、製品・技術・販売に関する問い合わせに回答するメール、テキスト・メッセージング、ソーシャルメディア投稿の生成にLLMを使用しています。また、外国語を話す顧客からの問い合わせを翻訳する業務にLLMを活用している企業もあります。LLMは、実用的な情報や関連ドキュメントの提供、過去のやりとりの要約、顧客へのフォローアップ、やりとりの記録などを行うことで、営業担当者やサポートエージェント（人間およびAI）を支援するよう構成することも可能です。

全世界100か国以上で事業を展開する世界有数のプロフェッショナルサービス企業が、LLMを活用とした生成AIアプリケーションの導入により、顧客関係管理への注力を強化しました。顧客フィードバック調査からより多くのインサイトを得るため、同社はLLMを導入し、回答における感情を分析しました。これによりAIはトレンドを抽出し、製品とサービスの評価状況や改善点に関する包括的なインサイトを提供できるようになりました。
自動化と生産性：大規模言語モデル（LLM）は、従来のAIモデルでは対応が困難だった複雑な意思決定を含む反復的な作業の自動化において、極めて効果的であることが実証されています。この自動化により、従業員は創造的思考や批判的思考を要するより高度な業務に集中できるようになり、従業員の生産性向上を促進することが可能です。

エージェントは、LLMの高度な推論機能を活用し、最小限の人間介入でワークフローを導く最先端のテクノロジーです。基盤となる言語モデルに基づいて構築されたこれらのアプリケーションは、企業環境内で人間や他のソフトウェアとやりとりしながら意思決定を行うように設計されており、さまざまな分野で自律的にタスクを実行でき、レビューや承認が必要なアクションの通知を生成することで、管理の徹底を支援します。

LLMはまた、ビジネス・リーダーやその他の意思決定者向けに迅速に関連情報を提示したり、マーケティング担当者向けのドラフトをを作成したり、開発者と共にソフトウェア・コードを記するなど、他の方法でも生産性を向上させています。

大規模言語モデルのユースケースと例

LLMは、拡大を続ける数多くのビジネス・ユースケースに適用されています。たとえば、多くの企業がカスタマーサービス戦略の一環としてチャットボットを導入しています。しかし、これらのモデルの多用途性により、創造的な企業アプリケーション開発者は、単純な言語的な回答生成にとどまらず、さまざまな課題に取り組むためにこの基盤となるテクノロジーを活用しています。

1. カスタマーサポートの自動化

カスタマーサポートは、企業環境におけるLLMの最も顕著な活用例であり、特に顧客に対して効果が発揮されます。言語モデルを活用した対話型ユーザインターフェース（チャットボット）は、24時間体制でほぼ無限の問い合わせに対応可能です。これにより、顧客のフラストレーションの主な原因である、負担過多のコールセンタースタッフに起因する応答時間を大幅に短縮することが可能です。

チャットボットを他のLLM搭載アプリケーションと統合することで、サポートコール後のフォローアップ業務（代替部品、ドキュメント、アンケートの送付など）を自動化できます。LLMはまた、人間のエージェントを直接支援し、タイムリーな情報提供、感情分析、翻訳、やりとりの要約などを実現します。

50か国以上、80言語以上で事業を運営するファンドマネージャーは、これらの機能を活用し、顧客が自身のニーズに最適な金融商品をより容易に見つけて選択できるようにしました。退職金口座管理を専門とする同社は、カスタマイズされたチャットボットによりカスタマーサポートを最新化し、サービスレベルを150％向上させるとともに、運用コストを30％削減しました。顧客は現在、同社のWebページにアクセスし、24時間いつでも、複数の言語でチャットボットに口座に関する質問をすることができます。

2. コンテンツの生成と要約

LLMは、オリジナルのコンテンツを生成したり、既存のコンテンツを要約することができます。どちらのユースケースも、大小さまざまな企業にとって非常に有用であり、レポート、メール、ブログ、マーケティング資料、ソーシャルメディア投稿の作成に生成AIを活用しながら、生成されたコンテンツを特定のグループや個々の顧客に合わせてカスタマイズできるようLLMの機能を活かしています。

要約は、分野に応じた配慮のもと、大量の情報を人間がより迅速に確認し、理解しやすい形式に凝縮します。LLMは、テキスト内のさまざまなアイデアの重要性を評価した上で重要な部分を抽出する方法、あるいは原文から最も適切かつ重要な情報と判断した内容を簡潔に要約する方法のいずれかでこれを実現します。

LLMは、要約が過度に一般的になり、原文の重要な詳細や強調点が抜け落ちる「平均的な要約」を行うと批判されることがあります。要約の信頼性を評価し、それに基づいてさまざまなモデルのパフォーマンスをランク付けすることも困難です。それでもなお、企業はこの機能を積極的に導入しています。

ある主要なクラウド通信企業は、数百件に及ぶサポートチケットの記録や、ほぼ20言語で毎日行われているチャットの記録を自動的に要約するためにLLMを導入しました。これらの要約は現在、サポート・エンジニアが顧客の課題を迅速に解決し、全体的なエクスペリエンスを向上できるよう支援しています。

3. 言語翻訳

Googleがトランスフォーマーを開発した当初の目的は、機械の言語間の翻訳能力を向上させることにありましたが、開発者がその幅広い機能に注目するようにになったのは後になってからでした。このアーキテクチャを初めて導入した開発者たちは、その目標を達成し、英語からドイツ語への翻訳において比類のないパフォーマンスを実現しました。しかも、従来のモデルよりも大幅に少ない時間とコンピューティング・リソースでこのモデルをトレーニングすることができました。

現代のLLMは、この限定的なユースケースをはるかに超えた進化を遂げています。ほとんどの場合、LLMは翻訳を専門にトレーニングされているわけではありせんが、両言語のデータセットで幅広い学習を行った際には、ある言語のテキストを解釈し、別の言語で明確に言い換えることに優れています。この言語の壁を打破する画期的な進歩は、国境を越えて事業を営む企業にとって極めて貴重です。多国籍企業は、高度な言語サービスを使用して、たとえば製品やサービスに対する多言語サポートの開発、ガイドやチュートリアル、マーケティング資料の翻訳、そして新しい国への進出時に既存の教育資料を用いた従業員教育などを行っています。

LLMの今後の展望

マルチモーダル・モデルの進歩

活発な研究分野として、言語以外のモダリティで出力を生成するAIの基盤モデルとしてのLLMの活用があげられます。LLMの驚異的な多用途性により、ラベル付きデータを用いたファインチューニングプロセスを通じて、音声や画像、さらには動画の解釈や生成が可能となります。プロンプトを受け取ったり、言語以外のモダリティで出力を生成するこれらのモデルは、大規模マルチモーダル・モデル（LMM）と呼ばれることがあります。

環境への配慮

LLMを開発し大規模に運用するには、通常、膨大な処理能力が必要となります。数百、時には数千ものGPUクラスタを用いて単一のモデルを数週間にわたりトレーニングする際に、膨大な量のエネルギーを消費する可能性があります。また、完成したモデルが導入された後も、推論を実行するインフラストラクチャは、絶え間ないユーザークエリに対応するために、引き続き多大な電力を必要とします。

GPT-4のトレーニングには推定50ギガワット時のエネルギーが必要でした。一方、50ギガワット時のエネルギーは、理論上、米国の平均的な家庭4,500から5,000世帯に1年間電力を供給できる量に相当します。現在、ChatGPTは毎日数百万件のクエリに対応するために、数百メガワット時の電力を消費していると推定されています。言語モデルがより大規模になるにつれ、エネルギー消費とサステナビリティに関する懸念はより深刻化する可能性が考えられます。そのため、人工知能企業はカーボン・フットプリントを削減するための代替エネルギー源の模索における最前線に立って取り組んできています。

OCI Generative AIによるLLMアプリケーションの構築

オラクルは、企業がこの画期的なテクノロジーの詳細な仕組みや電力需要に煩わされることなく、LLMの力を活用できるようにします。Oracle Cloud Infrastructure (OCI) Generative AIは、複雑なインフレストラクチャの管理を回避しつつ、カスタマイズされた、非常に効果的でコスト効率の高い方法で最新のLLMの導入を簡素化する、フルマネージド・サービスです。企業は複数の基盤モデルから選択したうえで、専用のGPUクラスター上で自社データを用いてそれらをファインチューニングし、ビジネス・ニーズに最適なカスタム・モデルを生成することが可能です。

基盤テクノロジーをより詳細に調整したいと考える企業は、Oracle Databaseの機械学習に注目しています。このプラットフォームは、機密データをOracle Databaseから移行する必要なく、機械学習ライフサイクルの主要要素を簡素化・自動化することで、データサイエンティストが迅速にモデルを構築できるようにします。機能には、一般的な機械学習フレームワーク、API、自動機械学習（AutoML）、コード不要のインターフェースに加え、アプリケーションで使用するモデルを生成するための30種類以上のハイパフォーマンスなデータベース内アルゴリズムが含まれます。

また、大手企業の多くは、Oracle AIインフラストラクチャを活用して独自のLLMを構築しています。AIサービスなどのより高いレベルのAIを支える基盤であり、高速化されたコンピューティング、ネットワーク、ストレージを備えた最も要求の厳しいLLMにも利用可能です。

大規模言語モデル（LLM）が企業の運営方法や顧客との関わり方を変革する可能性は非常に大きく、このテクノロジーにおける新たなブレークスルーや投資は、世界市場を動かし、企業戦略を一変させる可能性があります。一方で、ビジネス・リーダーやITリーダーにとっては、このテクノロジーから得られる多くの具体的なメリットを特定しようと努める一方で、誇大評価を冷静に捉え、LLMの基本的な仕組み、その限界、導入における課題を理解することが重要です。

LLMは、私たちの働き方を変革する多くの画期的な技術を支えています。

eBookを読む

LLMに関するFAQ

大規模言語モデルを特定用途向けにファインチューニングする方法を教えてください。

大規模言語モデル（LLM）は、自己学習を用いた事前学習段階を経て基盤モデルを構築した後、より少量のドメイン特化型ラベル付きデータを用いた教師あり学習段階を経ることで、特定の用途向けにファインチューニングされます。

大規模言語モデルの活用により最もメリッを得る業界を教えてください。

ほぼすべての業界がLLMのメリットを認識しつつあります。医療、金融サービス、小売などでは、カスタマーサポートの改善やビジネス・プロセスの自動化など、さまざまなユースケースの検討が進められています。

大規模言語モデルはエンタープライズ・システムと統合可能でしょうか。

大規模言語モデルは、基盤モデルをエンタープライズ・データでファインチューニングし、検索拡張生成を通じて独自データでモデルを拡張することで、エンタープライズ・システムと統合されることがよくあります。