メインコンテンツにスキップ

"音声文字変換"でタグ付けされた1 投稿

すべてのタグを見る

Cuckooポータルに音声文字変換を導入:あなたの言葉がテキストに変わる

· 1 分読了
Lark Birdy
Chief Bird Officer

チームの通話のフォローアップ、ポッドキャストの番組ノートの作成、調査インタビューの収集など、明確な記録は重要です。Cuckoo Networkでは、クリエイターやビルダーを支援するツールを継続的に構築しています。そのため、本日よりCuckooポータルで、数回クリックするだけで音声ファイルをきれいに整形されたテキストに変換できるようになったことを発表できることを大変嬉しく思います。

Cuckooポータルに音声文字変換を導入:あなたの言葉がテキストに変わる

音声文字変換でできること

私たちの新機能は、強力かつユーザーフレンドリーに設計されており、ワークフローを最初から最後まで効率化します。

ドラッグ&ドロップによるアップロード: オーディオファイルをポータルにドラッグ&ドロップするだけで簡単に始められます。MP3、WAV、M4Aなど、幅広い一般的な形式をサポートしており、すでにお持ちのファイルで作業できます。

高速、多言語対応の音声認識: 当社の文字起こしサービスの中核をなすのは、68万時間もの多様な音声で訓練された最先端モデル、OpenAIのWhisperです。これにより、様々な言語、アクセント、方言で堅牢なパフォーマンスを発揮し、録音の精度を高めます。

2つの出力、1回の処理: 様々なニーズに対応するため、文字起こし結果を2つのバージョンで同時に提供します。未加工の機械文字起こしと、句読点や書式が整えられたAI強化版の両方を受け取ります。これは、迅速なレビューや、直接公開できるコンテンツに最適です。

オンチェーン決済: 透明で分散化されたエコシステムの精神に基づき、各文字起こしジョブは一律18 CAIトークンです。現在のCAI残高はポータルの右上隅に常に表示されるため、常に状況を把握できます。

仕組み

プロセスは非常に簡単です:

  1. Cuckooポータルの左サイドバーにある「音声文字変換」に移動します。
  2. 指定されたボックスにファイルをドラッグするか、クリックしてコンピューターから選択してアップロードします。
  3. 文字起こしプロセスが自動的に開始されるまで、しばらくお待ちください。
  4. 整形されたテキストをメモ、ブログ、データセット、またはその他の用途のためにコピーまたはダウンロードします。

これを構築した理由

この新機能は、成長するコミュニティのニーズに直接応えるものです。

よりスムーズなクリエイターワークフロー: 多くの方がすでにCuckooをAI生成アートやチャットエージェントに活用されています。正確な文字起こしにより、話されたコンテンツをビデオの字幕、検索に優しい記事、独自のAIモデル用のラベル付きトレーニングデータなど、様々な形式に再利用することがこれまで以上に簡単になります。

あなたが管理するデータ: 私たちはあなたのプライバシーを真剣に考えています。あなたの音声ファイルは、WhisperのAPIを介した処理を除き、当社のインフラストラクチャから出ることはありません。文字起こしの結果は、あなたのポータルセッション内でのみ表示され、共有されることはありません。

シンプルなトークンエコノミー: このサービスをCAIで価格設定することにより、プラットフォームの利用とネットワーク全体の活動を一致させる、透明で分かりやすいコスト構造を維持しています。

今後の展望

私たちはまだ始まったばかりです。現在検討しているいくつかの機能強化を以下に示します:

  • 大規模な研究プロジェクトや広範な音声アーカイブを処理するためのバッチアップロード。
  • 単一の録音で異なる話者を区別し、ラベル付けするための話者分離。
  • Cuckoo Chatへの直接エクスポートにより、文字起こしされた録音で即座にQ&Aセッションを開始できます。

他にアイデアや見たい機能はありますか?Discordの#feature-requestsチャンネルでご提案を共有してください。

試してみませんか?https://cuckoo.network/transcribeにアクセスするか、Cuckooポータルの音声文字変換タブで最初のファイルを処理してみてください。Cuckoo Networkの一員として、そしてすべての人にとってより便利で創造的なエコシステムを構築する手助けをしてくださり、いつもありがとうございます。