Cập nhật: 17:53 06/06/2020

Hình mẫu trong sản xuất tin bài tự động bằng trí tuệ nhân tạo

Hãng thông tấn Press Association mới đây đã giới thiệu một dịch vụ đưa tin mới mang tên RADAR. RADAR là viết tắt của “Reporters and Data and Robots”, nghĩa là “Phóng viên, Dữ liệu và Robot”, và thực tế hệ thống sử dụng 3 nhân tố đó để sản xuất tin bài ở một tần suất và độ chính xác đến khó tin.

Được đưa vào hoạt động từ tháng 12/2017 với sự cộng tác từ công ty công nghệ Urbs Media và khoản hỗ trợ 150 triệu euro từ quỹ sáng kiến báo điện tử của Google (Digital News Initiative Innovation Fund), công nghệ trí tuệ nhân tạo (AI) này sẽ khai thác kho dữ liệu công cộng bao trùm các mảng như tội phạm, y tế, giáo dục hay giao thông, rồi sau đó chắt lọc lại thành tin dành cho các địa phương, vùng miền.

Những phóng viên chuyên môn cao được mời về dự án RADAR, và một nhóm khoảng 6 phóng viên sẽ tìm ra đoạn đáng chú ý trong biển dữ liệu và gắn cho đoạn này những cụm từ hoặc câu mô tả tác động, ví dụ như “giúp nâng cao chuẩn mực của quốc gia”.

Đến tháng 6/2018, Press Association cho biết đã có hơn 1.000 đầu báo địa phương dùng tin bài sản xuất bởi sự kết hợp giữa phóng viên và trí tuệ nhân tạo của RADAR khi hệ thống này được mở thử nghiệm ở Anh. Qua trang web radarai.com, bất kỳ tờ báo địa phương nào cũng có thể đăng ký lấy tin bài được sản xuất tự động liên quan đến địa phương mình.

Khi đó RADAR đã có 4.000 phiên bản địa phương hóa của hàng tá tin bài từ phóng viên của họ. Sau đó hàng tuần đội ngũ phóng viên của RADAR cũng sẽ xac minh, và xây dựng khung bài viết cho 15 câu chuyện hàng tuần từ kho dữ liệu quốc gia, và sẽ có khoảng 250 phiên bản của mỗi câu chuyện, nhân lên tạo nên số lượng tin bài địa phương hóa hàng tuần lên đến 4.000.

Báo điện tử dùng AI viết tin bài thành công

Tổng biên tập Press Association, ông Pete Clifton chia sẻ trong hội thảo Newsrewired hồi tháng 11/2018 rằng RADAR sử dụng kỹ thuật xử lý ngôn ngữ tự nhiên, dựa vào đó để sản xuất tin bài dài khoảng 8-9 đoạn viết về một câu chuyện nào đó cho các địa phương khác nhau với mỗi tập dữ liệu.

Pete Clifton khẳng định: “Chúng tôi có thể kỳ vọng có 300 đến 400 phiên bản tin bài khác nhau và tất cả đều phù hợp. Tất nhiên sẽ có những đoạn văn, cụm từ giống nhau vì chỉ có một số lượng nhất định cụm từ mô tả mà chúng tôi đưa vào, nhưng tin bài nào cũng sẽ giống như tin bài tự sản xuất vậy”.

Những tin bài sau khi ra lò sẽ được upload lên trang web của RADAR, nơi mà các đối tác của Press Association có thể đơn giản là chọn dùng một phiên bản tin bài, hoặc dùng nó để làm cốt lõi và đưa thêm vào phản ánh phản ứng xung quanh và bối cảnh rộng hơn từ đó biến thành một bài trang nhất hoặc bài đinh trang trong.

Hình mẫu trong sản xuất tin bài tự động bằng trí tuệ nhân tạo

Trên hình làTổng biên tập Press Association, ông Pete Clifton chia sẻ trong hội thảo Newsrewired hồi tháng 11/2018.

“Đây là câu chuyện về một cấp độ đặc biệt của đưa tin mà chúng ta chưa từng đủ sức làm”, Clifton nói. “Dù Press Association có phóng viên thường trú rải khắp đất nước, thì đạt đến mức độ chi tiết tường tận đến từng thị trấn như thế này là không thể nếu không có công nghệ”.

“Đó cũng không phải câu chuyện về thay thế, mà là câu chuyện về việc sử dụng công nghệ song hành cùng phóng viên. Chúng tôi thực tế đã tuyển thêm phóng viên để phụ trách làm việc với công nghệ này”.

Tổng biên tập Press Association cũng chia sẻ rằng kỹ năng làm báo và AI kết hợp có thể giúp hỗ trợ sự dân chủ ở địa phương, hỗ trợ giám sát tiền thuế của người dân được chi tiêu như thế nào.

Trong thời gian tới Press Association sẽ tính phương án thương mại hóa dịch vụ khi mà thời hạn dùng thử khép lại, có thể sẽ là một hệ thống trả phí linh hoạt mà mức phí phụ thuộc vào số lượng đầu báo địa phương đăng ký dùng.

Từ khóa:

CÁC BÀI VIẾT KHÁC:

© Copyright 2008-2020 Công ty Phần mềm & Truyền thông VIỆT LONG
Địa chỉ:
Điện thoại:
Email:
Website: https://vietlong.org
Facebook: