Bỏ qua nội dung chính

Giới thiệu tính năng Chuyển đổi Âm thanh thành Văn bản trên Cổng Cuckoo: Lời nói của bạn, được biến đổi

· Một phút đọc
Lark Birdy
Chief Bird Officer

Việc ghi chép rõ ràng rất quan trọng—dù bạn đang theo dõi một cuộc họp nhóm, soạn thảo ghi chú cho podcast, hay thu thập các cuộc phỏng vấn nghiên cứu. Tại Cuckoo Network, chúng tôi không ngừng xây dựng các công cụ để trao quyền cho những người sáng tạo và nhà phát triển. Đó là lý do chúng tôi rất vui mừng thông báo rằng bắt đầu từ hôm nay, Cổng Cuckoo cho phép bạn biến các tệp âm thanh thành văn bản được định dạng gọn gàng chỉ trong vài cú nhấp chuột.

Giới thiệu tính năng Chuyển đổi Âm thanh thành Văn bản trên Cổng Cuckoo: Lời nói của bạn, được biến đổi

Bạn có thể làm gì với tính năng Chuyển đổi Âm thanh thành Văn bản

Tính năng mới của chúng tôi được thiết kế vừa mạnh mẽ vừa thân thiện với người dùng, giúp tối ưu hóa quy trình làm việc của bạn từ đầu đến cuối.

Tải lên bằng cách Kéo và Thả: Bắt đầu đơn giản như việc kéo tệp âm thanh của bạn và thả vào cổng. Chúng tôi hỗ trợ nhiều định dạng phổ biến, bao gồm MP3, WAV, M4A và một số định dạng khác, đảm bảo bạn có thể làm việc với các tệp mình đang có.

Chuyển đổi Giọng nói thành Văn bản Nhanh chóng, Đa ngôn ngữ: Trọng tâm của dịch vụ chuyển đổi của chúng tôi là Whisper của OpenAI, một mô hình tiên tiến được đào tạo trên 680.000 giờ âm thanh đa dạng. Điều này cho phép hiệu suất mạnh mẽ trên nhiều ngôn ngữ, giọng điệu và phương ngữ khác nhau, mang lại độ chính xác cao cho các bản ghi của bạn.

Hai Đầu ra, Một Lần Xử lý: Để đáp ứng các nhu cầu khác nhau, chúng tôi cung cấp đồng thời hai phiên bản bản ghi của bạn. Bạn sẽ nhận được bản ghi máy thô, chưa lọc cùng với phiên bản được tăng cường AI với dấu câu và định dạng được trau chuốt. Điều này hoàn hảo cho việc xem xét nhanh hoặc cho nội dung sẵn sàng xuất bản trực tiếp.

Thanh toán trên Chuỗi: Với tinh thần của một hệ sinh thái minh bạch và phi tập trung, mỗi công việc chuyển đổi có mức phí cố định là 18 token CAI. Số dư CAI hiện tại của bạn luôn hiển thị ở góc trên bên phải của cổng, vì vậy bạn luôn kiểm soát được.

Cách thức hoạt động

Chúng tôi đã làm cho quy trình trở nên cực kỳ đơn giản:

  1. Điều hướng đến “Chuyển đổi Âm thanh thành Văn bản” trong thanh bên trái của Cổng Cuckoo.
  2. Tải lên tệp của bạn bằng cách kéo vào hộp được chỉ định hoặc nhấp để chọn từ máy tính của bạn.
  3. Chờ vài khoảnh khắc khi quá trình chuyển đổi bắt đầu tự động.
  4. Sao chép hoặc tải xuống văn bản đã được làm sạch để ghi chú, blog, tập dữ liệu hoặc bất kỳ trường hợp sử dụng nào khác.

Lý do chúng tôi xây dựng tính năng này

Tính năng mới này là phản ứng trực tiếp với nhu cầu của cộng đồng đang phát triển của chúng tôi.

Quy trình làm việc của người sáng tạo mượt mà hơn: Nhiều bạn đã tận dụng Cuckoo cho nghệ thuật tạo ra bằng AI và các tác nhân trò chuyện. Các bản ghi chính xác giúp việc tái sử dụng nội dung nói thành nhiều định dạng khác nhau dễ dàng hơn bao giờ hết, chẳng hạn như phụ đề cho video, bài viết thân thiện với tìm kiếm hoặc dữ liệu đào tạo được gắn nhãn cho các mô hình AI của riêng bạn.

Dữ liệu bạn kiểm soát: Chúng tôi rất coi trọng quyền riêng tư của bạn. Các tệp âm thanh của bạn không bao giờ rời khỏi cơ sở hạ tầng của chúng tôi, ngoại trừ việc xử lý thông qua API của Whisper. Kết quả chuyển đổi của bạn chỉ được hiển thị trong phiên cổng của bạn và không bao giờ được chia sẻ.

Một nền kinh tế token đơn giản: Bằng cách định giá dịch vụ này bằng CAI, chúng tôi duy trì một cấu trúc chi phí minh bạch và đơn giản, phù hợp với việc sử dụng nền tảng của chúng tôi với hoạt động tổng thể của mạng.

Nhìn về phía trước

Chúng tôi chỉ mới bắt đầu. Dưới đây là một vài cải tiến chúng tôi đang khám phá:

  • Tải lên hàng loạt để xử lý các dự án nghiên cứu lớn và kho lưu trữ âm thanh mở rộng.
  • Phân tách người nói để phân biệt và gắn nhãn các người nói khác nhau trong một bản ghi duy nhất.
  • Xuất trực tiếp sang Cuckoo Chat, cho phép bạn bắt đầu ngay một phiên hỏi đáp với các bản ghi đã được chuyển đổi.

Bạn có ý tưởng hoặc tính năng nào khác muốn thấy không? Chúng tôi mời bạn chia sẻ đề xuất của mình trong kênh #feature-requests trên Discord của chúng tôi.

Sẵn sàng để thử chưa? Hãy truy cập https://cuckoo.network/transcribe hoặc tab Chuyển đổi Âm thanh thành Văn bản trong Cổng Cuckoo và chạy tệp đầu tiên của bạn. Như mọi khi, cảm ơn bạn đã là một phần của Cuckoo Network và đã giúp chúng tôi xây dựng một hệ sinh thái hữu ích và sáng tạo hơn cho mọi người.