Speechify, một cái tên quen thuộc trong lĩnh vực chuyển đổi văn bản thành giọng nói, đang mở rộng phạm vi hoạt động của mình bằng cách tích hợp các tính năng mới dựa trên giọng nói vào tiện ích mở rộng Chrome. Động thái này đánh dấu một bước tiến quan trọng, hướng Speechify đến việc trở thành một nền tảng tương tác bằng giọng nói toàn diện hơn, vượt xa chức năng đọc văn bản truyền thống. Sự bổ sung đáng chú ý bao gồm tính năng gõ bằng giọng nói (voice typing) và một trợ lý ảo thông minh, cả hai đều được thiết kế để nâng cao trải nghiệm người dùng trong quá trình duyệt web và làm việc trực tuyến.
Trong bối cảnh công nghệ nhận dạng giọng nói ngày càng phát triển, với những cải tiến đáng kể về độ chính xác trong vòng 12 tháng qua, Speechify đã quyết định tận dụng xu hướng này. Việc giới thiệu công cụ gõ bằng giọng nói của Speechify cho phép người dùng chuyển đổi giọng nói thành văn bản một cách trực tiếp, tạo điều kiện thuận lợi cho việc soạn thảo email, viết tài liệu và thực hiện các tác vụ nhập liệu khác một cách nhanh chóng và hiệu quả. Giống như các công cụ dictation khác, tính năng này của Speechify được thiết kế để tự động sửa lỗi và loại bỏ các từ đệm, giúp tạo ra văn bản rõ ràng và dễ đọc.
Mặc dù vậy, trong quá trình thử nghiệm ban đầu, một số người dùng đã ghi nhận còn một số hạn chế, đặc biệt là về độ chính xác và khả năng tương thích trên một số nền tảng nhất định. Mặc dù hoạt động tốt trên các nền tảng như Gmail và Google Docs, việc kích hoạt và sử dụng tính năng gõ bằng giọng nói trên các trang web như WordPress có thể gặp khó khăn hơn. Đại diện Speechify cho biết công ty đang tích cực tối ưu hóa tính năng này để tương thích tốt hơn với các trang web phổ biến và cải thiện độ chính xác tổng thể. Các số liệu ban đầu cho thấy tỷ lệ lỗi từ (word error rate) của Speechify có phần cao hơn so với một số đối thủ cạnh tranh khác. Tuy nhiên, công ty nhấn mạnh rằng mô hình của họ sẽ học hỏi và cải thiện theo thời gian sử dụng, và tỷ lệ lỗi sẽ giảm dần khi người dùng tương tác nhiều hơn với công cụ.
Điểm nhấn quan trọng khác là việc ra mắt một trợ lý ảo hội thoại, tích hợp trực tiếp vào thanh bên của trình duyệt Chrome. Trợ lý này được thiết kế để trả lời các câu hỏi liên quan đến nội dung trên trang web hiện tại. Người dùng có thể yêu cầu trợ lý tóm tắt các ý chính, giải thích các khái niệm phức tạp bằng ngôn ngữ đơn giản hơn, hoặc thậm chí đặt các câu hỏi cụ thể về thông tin trên trang. Đây là một bước đi táo bạo của Speechify, trong bối cảnh các công ty công nghệ lớn như ChatGPT và Gemini đã có những trợ lý ảo tương tự. Tuy nhiên, Speechify tin rằng các đối thủ cạnh tranh đang đặt trải nghiệm bằng giọng nói ở vị trí thứ yếu, trong khi Speechify lại tập trung vào việc đặt giọng nói làm phương thức tương tác chính, mặc định cho người dùng. Rohan Pavuluri, Giám đốc Kinh doanh của Speechify, nhấn mạnh rằng công ty nhận thấy một phân khúc thị trường lớn, bao gồm cả người dùng hiện tại của họ, muốn giọng nói là phương thức chính để tương tác với các ứng dụng và trí tuệ nhân tạo (AI).
Mặc dù có những hứa hẹn lớn, trợ lý ảo của Speechify vẫn còn một số hạn chế nhất định. Hiện tại, nó chưa tương thích với các trình duyệt có tích hợp sẵn trợ lý ảo, ví dụ như OpenAI’s Atlas, Perplexity’s Comet và Dia. Tuy nhiên, Speechify không quá lo lắng về vấn đề này, vì tiện ích mở rộng chủ yếu hướng đến người dùng Chrome, một cộng đồng người dùng cực kỳ lớn. Công ty cũng có kế hoạch mở rộng các tính năng gõ bằng giọng nói và trợ lý ảo trên tất cả các ứng dụng của mình, bao gồm cả trên máy tính và thiết bị di động. Ngoài ra, Speechify cũng đang nghiên cứu phát triển các tác nhân AI (AI agents) có khả năng thực hiện các tác vụ thay cho người dùng. Một ví dụ cụ thể được đưa ra là khả năng tự động thực hiện cuộc gọi để đặt lịch hẹn hoặc chờ đợi trong hàng đợi hỗ trợ khách hàng. Các công ty khác như Truecaller và Cloacked cũng đang theo đuổi các mục tiêu tương tự, cho thấy sự cạnh tranh ngày càng gay gắt trong lĩnh vực này.
Sự xuất hiện của các tính năng mới này cho thấy Speechify đang nỗ lực đa dạng hóa sản phẩm và định vị mình là một người chơi quan trọng trong thị trường AI hướng đến giọng nói. Với những cải tiến liên tục và sự tập trung vào trải nghiệm người dùng, Speechify có tiềm năng thu hút một lượng lớn người dùng mới và củng cố vị thế của mình trong ngành công nghệ đang phát triển nhanh chóng.

