Thị trường Text To Speech năm 2016: 1,3 tỉ USD, dự đoán 2022: 3.03 tỉ USD - Nguồn: Secondary Literature, Expert Interviews và MarketsandMarkets
Công nghệ Mobifone TTS là gì?
MobiFone TTS (MobiFone text to speech) là công nghệ chuyển đổi văn bản thành giọng nói tiếng Việt có cảm xúc trên nền tảng trí tuệ nhân tạo (AI). Đây là công nghệ hiểu văn bản và ngôn ngữ tự nhiên để tạo ra âm thanh tổng hợp hoàn chỉnh với nhịp điệu và ngữ điệu phù hợp.
Công nghệ TTS đã được nghiên cứu khoảng vài chục năm trước, đặc biệt phát triển mạnh trong 10-15 năm gần đây. TTS phát triển gần như hoàn thiện ở nước ngoài, đặc biệt tại các nước sử dụng tiếng Anh.
Tuy nhiên để áp dụng cho tiếng Việt và có kết quả có thể áp dụng thực tiễn thì MobiFone là một trong những đơn vị tiên phong. Sự khác biệt của MobiFone TTS là tổng hợp tiếng nói theo ngữ cảnh giúp tiếng nói đầu ra tự nhiên, gần với giọng người hơn.
Giải pháp MobiFone TTS giải quyết được các vấn đề đặc thù của ngôn ngữ tiếng Việt, tính toán tối ưu được dữ liệu, thiết kế giọng đọc và cấu trúc ngôn ngữ để bao phủ được toàn bộ câu, cụm từ, từ, âm tiết, âm vị, ngữ âm và các ngữ cảnh khác nhau, thành phần câu trong văn bản.
Điều này phải bắt đầu từ việc phân tích ngôn ngữ sau đó mới đến cấu trúc hệ thống và tối ưu dữ liệu.
TTS thị trường mới, giải pháp mới và dịch vụ mới
TTS có mặt trong mọi lĩnh vực như điện tử, tự động hóa, giao thông thông minh, giáo dục, sức khỏe.... TTS có mặt trong các tổng đài thông minh tự động thay thế con người trả lời khách hàng, có mặt trong các ứng dụng chỉ đường hay điều khiển xe thông minh.
Ngoài ra TTS các thiết bị y tế, máy móc thiết bị có thể trao đổi với con người... Các giải pháp thu âm thủ công hay nội dung nhân tạo sẽ là các xu hướng tiếp theo mà TTS hướng tới.
Một trong những đặc trưng của TTS là một trong những giải pháp cho thiết bị, con người có thể tương tác với nhau qua giọng nói tự nhiên.
Cũng tương tự Google hay Amazone… MobiFone ra mắt giải pháp hoàn thiện về TTS Cloud (mobifone.ai), qua đó cho phép doanh nghiệp, đơn vị giải pháp hay người dùng cuối có thể sử dụng MobiFone TTS một cách dễ dàng và chủ động.
Với doanh nghiệp, đơn vị giải pháp hay lập trình viên, có thể sử dụng các giao tiếp qua API một cách đơn giản và trực quan. Với người dùng cuối (user), MobiFone cũng cung cấp các giao diện để sử dụng một cách dễ dàng nhất.
Giao diện của MobiFone TTS
MobiFone và những dịch vụ áp dụng TTS ở Việt Nam
Từ tháng 7-2019, báo Đầu Tư là một trong những báo đầu tiên cung cấp cho độc giả tiện ích báo nói ứng dụng công nghệ trí tuệ nhân tạo (AI) do MobiFone nghiên cứu. Cùng với báo Đầu Tư, hàng loạt các tờ báo khác như Lao Động, Công Luận… cũng bắt đầu đưa ứng dụng báo nói ứng dụng công nghệ AI Text to Speech (TTS) phục vụ độc giả.
Báo nói chỉ là một trong những giải pháp đóng gói dựa trên nền tảng TTS cloud mà MobiFone cung cấp cho thị trường nội dung nói chung và các trang điện tử nói riêng. Báo nói sẽ mang tới trải nghiệm mới cho người dùng trong việc tiếp cận nội dung đặc biệt với người già, người khiếm thị…
Bên cạnh báo nói, MobiFone cũng dự kiến ra mắt các giải pháp về tổng đài thông minh, báo hình, lồng tiếng phim tự động, sách nói trong thời gian sớm nhất.
"Chúng tôi mong muốn tạo ra một nền tảng mở về TTS, để cung cấp và tích hợp vào các giải pháp, ứng dụng mà các đơn vị đang cung cấp. Với mong muốn tạo ra những dịch vụ mới thông minh hơn, hữu ích hơn cho người dùng, thay thế cho các dịch vụ truyền thống cũ đã trở nên lạc hậu.
Các ứng dụng mà chúng tôi đang phối hợp để tích hợp và triển khai bao gồm báo nói, báo hình, sách nói, camera thông minh, tổng đài thông minh…
MobiFone mong muốn cung cấp công nghệ lõi, còn đóng gói và cung cấp giải pháp, chúng tôi kỳ vọng vào sự sáng tạo của các công ty và cộng đồng. Có như vậy mới thúc đẩy giải pháp TTS của chúng tôi ngày càng có ích cho thị trường, xã hội" - ông Dư Thái Hùng, giám đốc Trung tâm Công nghệ thông tin MobiFone, cho biết.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận