埋め込み(エンベディング)
重要なポイント
- 意味を数で表す仕組み
- 似た意味を見つけやすい
- 検索やRAGで使われる
なぜ大切か
意味を数で表すと、似た意味の文章をコンピュータが見つけやすくなります。検索や関連情報の表示に使われます。
身近な例
「犬」と「子犬」は近い数になり、「自動車」は遠い数になります。これを使う仕組みにRAGがあります。
関連する考え方
トークンとのちがい
トークンは文章を分ける単位、埋め込みは意味を表す数という役割のちがいがあります。
合わせて確認したいのが、大規模言語モデル(LLM)です。
よくある質問
埋め込みは初心者も知っておくべきですか。
言葉だけ知っておけば十分です。検索やRAGの話で出てくる考え方です。
埋め込みとは何ですか。
言葉や文章の意味を、数のならびで表す仕組みのことです。意味の近さをコンピューターが扱いやすくなります。
埋め込みは何の役に立ちますか。
意味の近い文章を探したり、似た内容をまとめたりするのに使われます。検索や分類の仕組みで活躍します。
参考にした情報源
- OpenAI ヘルプセンター 使い方やトラブルの公式案内です。