BLOG
Tóm tắt: Với sự tích hợp của công nghệ AI (trí tuệ nhân tạo), những bước tiến mới trong lĩnh vực transcription (ghi thoại) đã xuất hiện. Tại Hansem Global, chúng tôi đã kết hợp AI với chuyên môn của con người, tạo ra các giải pháp transcription nhanh hơn và chính xác hơn nhằm dẫn đầu xu hướng. Bài viết này sẽ trình bày phương pháp transcript truyền thống, giới thiệu phương pháp tiếp cận mới với sự hỗ trợ của AI và cách tiếp cận sáng tạo của Hansem Globals giúp nâng cao các tiêu chuẩn của ngành.
Scripted by
Van Mac
Dịch vụ transcription nhằm chuyển đổi các từ, từ bản ghi âm hoặc video sang văn bản viết. Dịch vụ này đóng vai trò quan trọng trong những lĩnh vực khác nhau, giúp đơn giản hóa quá trình đọc, phân tích và lưu trữ nội dung đã ghi âm. Transcription được sử dụng cho nhiều mục đích khác nhau:
Trước khi có sự tích hợp với AI, quy trình transcription thủ công bao gồm rất nhiều bước, mỗi bước đều đòi hỏi rất nhiều sự tỉ mỉ, thời gian và công sức để đảm bảo chất lượng và độ chính xác cao. Hãy cùng xem ví dụ dưới đây để hiểu được quy trình làm việc này.
VÍ DỤ | |||
Độ dài file âm thanh: 1h | Chủ đề: Y tế | Số người nói: 3 | Chất lượng: Có một ít tiếng ồn nền |
1. Kiểm tra chất lượng ban đầu (20 phút)
Trước khi transcribe, file âm thanh sẽ được kiểm tra để đánh giá chất lượng âm thanh và phát hiện các vấn đề tiềm ẩn có thể ảnh hưởng đến tính chính xác của bản ghi.
2. Chỉ định transcriber (10 – 15 phút)
Sau khi kiểm tra chất lượng hoàn tất, các file âm thanh sẽ được giao cho transcriber (người ghi thoại) thích hợp, tùy thuộc vào chủ đề của file và ngữ âm của người nói.
3. Transcriber nghe và ghi lại (5 - 6 giờ)
Tiếp theo transcriber sẽ nghe và ghi lại nội dung của file âm thanh. Theo tiêu chuẩn của lĩnh vực này, một file âm thanh cơ bản, có độ dài 1 giờ (chất lượng âm thanh tốt, nội dung không mang tính kỹ thuật và không nói tình trạng nói chen) sẽ được transcribe trong vòng 4 giờ. Tuy nhiên, nếu chất lượng âm thanh kém, transciber sẽ phải tốn nhiều thời gian hơn để hoàn thành công việc.
4. Gắn mốc thời gian (1 - 2 giờ)
Gắn mốc thời gian là một bước tốn thời gian khác vì nó đòi hỏi phải dừng và bắt đầu ghi âm thường xuyên để ghi lại mốc thời gian chính xác. Thời gian làm bước này có thể kéo dài từ 1 đến 2 giờ nữa, tùy thuộc vào tần suất mốc thời gian (ví dụ: mỗi phút, mỗi lần thay đổi người nói, v.v.).
5. Định dạng người nói (20 – 30 phút)
Định dạng và dán nhãn những người nói khác nhau có trong file âm thanh là một nhiệm vụ quan trọng khác, đặc biệt là trong các tình huống có nhiều người nói như hội thoại, phỏng vấn hoặc hội nghị. Thời gian trung bình cho bước này là 20 – 30 phút với đoạn hội thoại có 2 – 3 người nói.
6. Đảm bảo chất lượng (Biên tập & Đọc soát) (2 giờ)
Sau đó, bản ghi sẽ trải qua quy trình đảm bảo chất lượng với việc biên tập và đọc soát để đảm bảo tính chính xác. Bản ghi sẽ được sửa các lỗi sai và tinh chỉnh để trở nên rõ ràng và mạch lạc. Thời gian cho bước này sẽ tốn khoảng 2 giờ.
7. Định dạng (1 giờ)
Bản ghi được định dạng theo yêu cầu của khách hàng. Bước này có thể mất thêm 1 giờ.
8. Nộp bài
Cuối cùng, bản ghi được giao cho khách hàng sau khi đã được hoàn thiện và chỉnh sửa.
Tổng thời gian ước tính: 10 – 12 giờ
Với quy trình làm việc này, với file âm thanh dài 1 giờ, chúng ta có thể cần đến 1,25 – 1,5 ngày làm việc để hoàn thiện bản ghi và gửi cho khách hàng.
Việc kết hợp công nghệ AI vào quy trình transcription đã tạo ra một cuộc cách mạng hóa cho lĩnh vực này. Các công cụ AI giúp nhanh chóng chuyển lời nói thành văn bản, giúp giảm đáng kể thời gian cần thiết của quy trình transcription. Thế nhưng, điều kỳ diệu mới thực sự xảy ra khi AI được kết hợp với chuyên môn của con người:
Bằng cách áp dụng phương pháp transcribe cải tiến hỗ trợ bởi AI này, Hansem Global đã nâng cao đáng kể vị thế của mình trong lĩnh vực cụ thể này.
Hãy cùng xem lại ví dụ trước, nhưng lần này, chúng ta sẽ áp dụng công cụ transcribe AI của Hansem Global kết hợp với chuyên môn của con người để xem quy trình này đã được nâng lên một tầm cao mới như thế nào.
VÍ DỤ | |||
Độ dài file âm thanh: 1h | Chủ đề: Y tế | Số người nói: 3 | Chất lượng: Có một ít tiếng ồn nền |
Nhờ quy trình cải tiến này mà thời gian làm việc được rút ngắn từ 1,5 ngày xuống chỉ còn 4-5 giờ. Các bản ghi sẽ được giao đển cho bạn chỉ trong vòng một ngày.
Nhờ phương pháp mới này, Hansem Global không chỉ bắt kịp các tiêu chuẩn của ngành mà còn thiết lập nên các tiêu chuẩn mới. Chúng tôi đã xử lý các dự án transcription lớn với tốc độ cùng với độ chính xác cao. Sao phải sử dụng những phương pháp cũ tốn thời gian, trong khi bạn có thể có được dịch vụ tốt và phương pháp mới nhất cùng chúng tôi? 😉
Unlock the power of seamless transcription with Hansem Việt Nam! Fast, accurate, and effortless – that’s our promise to you. 🚀Contact us today and watch your audio transform into flawless text, and let us take your content to the world.
Hansem Global is an ISO Certified and globally recognized language service provider. Since 1990, Hansem Global has been a leading language service company in Asia and helping the world’s top companies to excel in the global marketplace. Thanks to the local production centers in Asia along with a solid global language network, Hansem Global offers a full list of major languages in the world. Contact us for your language needs!
2024.11.25
2024.10.23
2024.08.16