Metaがミュージシャン向けのChatGPTタイプであるAudioCraftをリリースしました

Metaがミュージシャン向けのChatGPTタイプであるAudioCraftをリリースしました

AudioCraftはオーディオを生成することができるため、テキストを通じて音楽も生成することができます。Metaにより、MusicGen、AudioGen、EnCodecにも自由にアクセスできるようになります。

MetasのAudioCraftでは楽器は必要ありません。それでも、必ずしも人工的なサウンドのテクノに限定されるわけではありません。Metaが開発した最新の生成AIツールは、MusicGen、AudioGen、EnCodecの3つの既存モデルを組み合わせたものです。これらを使用して、テキストを入力し音楽を生成および編集することができます.

AudioCraftの対象となるのはミュージシャンとクリエイターです

Meta独自のライセンス音楽で訓練されたMusicGenは、テキストプロンプトから音楽を作成することができます。AudioGenは音響効果を専門としており、EnCodecはMetaが更新バージョンを提供するデコーダーです。これらの技術を用いることで、アーチファクトや粗末なトーンの少ない高品質の音楽を生成することが期待されます。

AudioGenは、コードを含む事前訓練済みモデルとしても公開されていますが、研究者向けには一定の制限があります。このモデルが処理できる効果音には、犬の鳴き声や車のクラクション、さまざまな種類の周囲騒音が含まれます。AudioCraftは音楽とサウンドを処理し、コンプレッサーとして機能し、オーディオを生成することができるため、音楽編集にも適しています。Metaは、MusicGenをかつてのシンセサイザーのような、全く新しい種類の楽器として捉えています。

AudioCraftの対象となるのはミュージシャンとクリエイターです

マーク・ザッカーバーグは自らの放送チャンネルでAudioCraftを紹介しました。音声サンプルも披露されました。それは「パーカッションを伴う砂漠の映画シーン」というプロンプトから始まり、実際にはすぐに少なくとも1つの荒れ果てた高速道路が思い浮かびます。しかし、ギターの音もあります。「80年代のエレクトロニックをドラムビートで」は、黒いアイライナーとフワフワしたヘアスプレーを使ったヘアスタイルを思い起こさせます。

Metaのブログ投稿によると、生成された人工知能に対する興奮の中で、オーディオはこれまで少し軽視されていました。音楽は「一連の音符から、複数の楽器による全体的な音楽構造まで、局所的なものから長期的なパターン」で構成されているため、最も作成が難しいオーディオです。「堅固なオープンソースの基盤モデルは、イノベーションを促進し、将来の音楽やオーディオの聴き方に貢献することができます。」とMetaは述べています。対象となるのはミュージシャンやサウンドデザイナーです。このツールでブレインストーミングや遊びを楽しむことができます。

しかし、Metaはクリエイターや企業も利益を得ると考えています。例えば、著作権を心配することなく、長時間検索することなく、自作の音楽を使ったリールやビデオを保存できます。

現在、MetaはAIの成果をエンドユーザーと研究者、開発者の両方に向けてオープンソースで公開することに積極的です。AI分野の他の主要企業とは異なります。OpenAIやGoogleは自社のモデルについて沈黙を守る傾向にあります。しかし、自由に利用できる言語モデルやさまざまなタイプの画像ジェネレーターも多くあります。

このページを評価する

BLOG

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています
ブログ

ChatGPT & Co.: BSIはセキュリティに対する「前例のない課題」を認識しています

サイバーセキュリティの現状は脅威であり、「いつでもエスカレートする可能性がある」とフェーザー内務大臣が警告しています。BSIは、国内のさらに多くのシステムをスキャンしたいと考えています。

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです
ブログ

金曜日:ChatGPTのニュースにもかかわらず、ヨーロッパ人3人がISSミッションに参加している一方、Bingの市場シェアは依然として低いままです

ChatGPT 検索エンジンにはボーナスなし + ISS ミッションは非公開で開始 + アイオワ対 TikTok + インディゲームのトレーラー + フランス対 Yahoo + 現金支払い限定

AIテキストジェネレーターのChatGPTが魅力的である理由
ブログ

AIテキストジェネレーターのChatGPTが魅力的である理由

変圧器ネットワークについて ChatGPTは、OpenAIが2020年に開発したGPT-3という言語モデルを基にしています。GPT-3は、ほぼ完璧な英語でさまざまなスタイルのテキストを生成する能力を持っています。このニューラルネットワークは、いわゆる事前学習を通じてインターネットからのテラバイト単位のテキストデータを学習しました。これが名前に「P」が含まれる理由です。また、生成するテキストがトレーニングデータ(名前の「G」)とできるだけ近くなるように学習しています。