Cuckoo 포털에 오디오 전사 기능 도입: 당신의 말을 텍스트로 변환
팀 통화 후속 조치, 팟캐스트 쇼 노트 작성, 연구 인터뷰 수집 등 명확한 기록은 중요합니다. Cuckoo Network는 크리에이터와 빌더에게 힘을 실어줄 도구를 지속적으로 구축하고 있습니다. 그래서 오늘부터 Cuckoo 포털에서 몇 번의 클릭만으로 오디오 파일을 깔끔하게 정리된 텍스트로 변환할 수 있게 되었다는 소식을 기쁘게 알려드립니다.
오디오 전사 기능으로 할 수 있는 것
저희의 새로운 기능은 강력하면서도 사용자 친화적으로 설계되어, 처음부터 끝까지 워크플로우를 간소화합니다.
드래그 앤 드롭 업로드: 오디오 파일을 포털로 드래그하여 놓는 것만큼 간단하게 시작할 수 있습니다. MP3, WAV, M4A 등 다양한 일반 형식을 지원하여 이미 가지고 있는 파일로 작업할 수 있습니다.
빠르고 다국어 지원되는 음성-텍스트 변환: 저희 전사 서비스의 핵심은 68만 시간의 다양한 오디오로 훈련된 최첨단 모델인 OpenAI의 Whisper입니다. 이를 통해 다양한 언어, 억양 및 방언에서 강력한 성능을 발휘하여 녹음 파일에 대한 높은 정확도를 제공합니다.
두 가지 출력, 한 번의 처리: 다양한 요구 사항을 충족하기 위해 전사 결과의 두 가지 버전을 동시에 제공합니다. 원본, 필터링되지 않은 기계 전사본과 함께 다듬어진 구두점 및 서식이 적용된 AI 향상 버전도 받게 됩니다. 이는 빠른 검토나 바로 게시할 준비가 된 콘텐츠에 적합합니다.
온체인 결제: 투명하고 분산된 생태계의 정신에 따라 각 전사 작업에는 18 CAI 토큰의 고정 요금이 부과됩니다. 현재 CAI 잔액은 포털의 오른쪽 상단 모서리에 항상 표시되므로 언제든지 제어할 수 있습니다.
작동 방식
저희는 이 과정을 매우 간단하게 만들었습니다:
- Cuckoo 포털의 왼쪽 사이드바에서 “오디오 전사”로 이동합니다.
- 파일을 지정된 상자로 드래그하거나 클릭하여 컴퓨터에서 선택하여 업로드합니다.
- 전사 프로세스가 자동으로 시작될 때까지 잠시 기다립니다.
- 정리된 텍스트를 메모, 블로그, 데이터셋 또는 기타 사용 사례를 위해 복사하거나 다운로드합니다.
이 기능을 구축한 이유
이 새로운 기능은 성장하는 커뮤니티의 요구에 대한 직접적인 응답입니다.
더욱 원활한 크리에이터 워크플로우: 많은 분들이 이미 AI 생성 아트 및 챗 에이전트를 위해 Cuckoo를 활용하고 있습니다. 정확한 전사본은 음성 콘텐츠를 비디오 자막, 검색 친화적인 기사 또는 자체 AI 모델을 위한 레이블링된 학습 데이터와 같은 다양한 형식으로 재활용하는 것을 그 어느 때보다 쉽게 만듭니다.
사용자가 제어하는 데이터: 저희는 귀하의 개인 정보를 중요하게 생각합니다. 오디오 파일은 Whisper의 API를 통한 처리를 제외하고는 저희 인프라를 벗어나지 않습니다. 전사 결과는 포털 세션 내에서만 표시되며 공유되지 않습니다.
간단한 토큰 경제: 이 서비스를 CAI로 가격 책정함으로써, 저희는 플랫폼 사용을 네트워크의 전반적인 활동과 일치시키는 투명하고 간단한 비용 구조를 유지합니다.
향후 계획
저희는 이제 막 시작했습니다. 이미 검토 중인 몇 가지 개선 사항은 다음과 같습니다:
- 대규모 연구 프로젝트 및 방대한 오디오 아카이브 처리를 위한 일괄 업로드
- 단일 녹음에서 다른 화자를 구별하고 레이블을 지정하는 화자 분리
- 전사된 녹음 파일로 즉시 Q&A 세션을 시작할 수 있 도록 Cuckoo Chat으로 직접 내보내기
다른 아이디어나 보고 싶은 기능이 있으신가요? Discord의 #feature-requests 채널에 제안을 공유해 주시기 바랍니다.
시도해 볼 준비가 되셨나요? https://cuckoo.network/transcribe로 이동하거나 Cuckoo 포털의 오디오 전사 탭에서 첫 번째 파일을 실행해 보세요. 언제나처럼 Cuckoo Network의 일원이 되어주시고 모두를 위한 더욱 유용하고 창의적인 생태계를 구축하는 데 도움을 주셔서 감사합니다.