Cuckoo Portal 推出音频转录功能:将您的言语转化为文字
清晰的记录至关重要——无论是跟进团队会议、撰写播客节目笔记,还是整理研究访谈。在 Cuckoo Network,我们持续构建工具,赋能创作者和开发者。因此,我们非常高兴地宣布,从今天起,Cuckoo Portal 现已支持您通过几次点击,将音频文件转换为整洁的文本。
音频转录功能助您实现什么
我们的新功能旨在强大且用户友好,从头到尾简化您的工作流程。
拖放上传: 开始使用非常简单,只需将您的音频文件拖放到门户中即可。我们支持多种常见格式,包括 MP3、WAV、M4A 等,确保您可以处理现有文件。
快速、多语言语音转文本: 我们的转录服务核心是 OpenAI 的 Whisper,这是一个经过 68 万小时多样化音频训练的先进模型。这使得它在各种语言、口音和方言中都能表现出色,为您的录音提供高准确度。
两 种输出,一次完成: 为满足不同需求,我们同时提供两种版本的转录文本。您将收到原始、未经筛选的机器转录文本,以及一个经过 AI 增强、标点和格式都更完善的版本。这非常适合快速审阅或直接发布的内容。
链上支付: 本着透明和去中心化生态系统的精神,每项转录任务的固定费用为 18 CAI 代币。您当前的 CAI 余额始终显示在门户的右上角,因此您始终掌控一切。
工作原理
我们已将流程设计得极其简单:
- 在 Cuckoo Portal 左侧边栏中导航至“音频转录”。
- 通过将文件拖入指定框或点击从您的计算机中选择来上传文件。
- 等待片刻,转录过程将自动开始。
- 复制或下载整理后的文本,用于您的笔记、博客、数据集或任何其他用途。
我们为何构建此功能
这项新功能直接回应了我们不断壮大的社区的需求。
更流畅的创作者工作流程: 你们中的许多人已经在使用 Cuckoo 进行 AI 生成艺术和聊天代理。准确的转录使得将口语内容重新利用为各种格式变得前所未有的容易,例如视频字幕、便于搜索的文章,或您自己 AI 模型的标注训练数据。
数据由您掌控: 我们非常重视您的隐私。您的音频文件绝不会离开我们的基础设施,除非通过 Whisper 的 API 进行处 理。您的转录结果仅在您的门户会话中显示,绝不会共享。
简单的代币经济: 通过以 CAI 定价此服务,我们保持了透明且直接的成本结构,将平台的使用与网络的整体活动保持一致。
展望未来
我们才刚刚开始。以下是我们正在探索的一些增强功能:
- 批量上传,用于处理大型研究项目和大量音频档案。
- 说话人分离,用于区分和标记单个录音中的不同说话人。
- 直接导出到 Cuckoo Chat,让您能够立即与转录的录音开始问答会话。
您是否有其他想法或希望看到的功能?我们邀请您在我们的 Discord 上的 #feature-requests 频道分享您的建议。
准备好尝试了吗?请前往 https://cuckoo.network/transcribe 或 Cuckoo Portal 中的音频转录选项卡,运行您的第一个文件。一如既往,感谢您成为 Cuckoo Network 的一部分,并帮助我们为所有人构建一个更有用、更具创造力的生态系统。