Big Data Và Công Nghệ BlockChain. Nguồn Dữ Liệu Big Data Khổng Lồ Như Thế Nào ?

Hệ điều hành điện toán đám mây Domo đã phân tích hoạt động sử dụng dữ liệu số toàn cầu trong năm qua và chia sẻ kết quả trong báo cáo “Data Never Sleeps” (Dữ liệu không bao giờ ngủ) 2018-2019.

Big data (dữ liệu lớn) có thể được coi là thuật ngữ biểu tượng của kỷ nguyên số. Với sự lên ngôi của mạng xã hội và thương mại trực tuyến, lượng dữ liệu được tạo ra trên Internet là một con số khổng lồ.

Theo thống kê của tạp chí Forbes, thị trường “Big data” hay dữ liệu lớn trên thế giới có trị giá là 205 tỷ đô la.

Dữ liệu đang được tạo ra và thu thập một cách chóng mặt. Đi kèm với việc khối dữ liệu khổng lồ được tạo ra thì các doanh nghiệp đang có nhu cầu đầu tư và cơ sở hạ tầng, phần mềm phân tích và dịch vụ lưu trữ, nghiên cứu phân tích cũng như đào tạo các chuyên gia khoa học dữ liệu để tạo ra giá trị từ số liệu sẵn có.

Với khối dữ liệu khổng lồ hiện có, học sâu (Deep Learning) đã trở thành phương pháp đang được các công ty lớn như như Google, Baidu, IBM đặc biệt quan tâm đến.  Tuy nhiên học sâu chỉ là một loại mô hình giám sát phức tạp trong các mô hình máy học đang được quan tâm trong lĩnh vực dữ liệu lớn hay “big data”.

Các mô hình máy học dùng để phân tích dữ liệu lớn có thể chia ra làm ba phạm trù chính: giám sát, không giám sát và học tăng cường. Học giám sát là các thuật toán máy học có khả năng dự đoán đầu ra của một mô hình dựa trên các yếu tố đầu vào. Học không giám sát là các mô hình hóa/phân cụm một tập dữ liệu không có các ví dụ đã được gắn nhãn sẵn. Học tăng cường là các mô hình trong đó thuật toán học một hành động tùy theo quan sát về môi trường xung quanh.

Mỗi hành động có tác động đến môi trường và thông tin phản hồi nhận được từ môi trường sẽ được cung cấp ngược lại để hướng dẫn cho thuật toán trong quá trình học. Học sâu đã được phát triển từ thập niên 60s, tuy nhiên gần đây vì xu hướng phát triển của big data nên học sau gần đây đã có những đột phát mới.

Trong năm 2012, thế giới có khoảng 2,2 tỷ người dùng Internet. Trong năm 2018, nhóm này có 3,8 tỷ người – gần 48% dân số toàn cầu. 

BIG DATA DÙNG CÔNG NGHỆ GÌ?

Một thông tin quan trọng là Big Data cần đến kĩ thuật khai thác thông tin rất đặc biệt do tính chất phức tạp và khổng lồ,Tập đoàn McKinsey đã phân tích và đề xuất những công nghệ có thể dùng với Big Data bao gồm:

  • Crowsourcing (tận dụng các nguồn lực từ nhiều thiết bị điện toán trên toàn cầu để xử lí dữ liệu cùng nhau)
  • Các thuật toán về gen và di truyền
  • Những biện pháp machine learning (ý chỉ các hệ thống có khả năng học hỏi từ dữ liệu, một nhánh của trí tuệ nhân tạo), xử lí ngôn ngữ tự nhiên (giống như Siri hay Google Voice Search, nhưng cao cấp hơn),
  • Xử lý tín hiệu, mô phỏng, phân tích chuỗi thời gian, mô hình hóa, kết hợp các server mạnh lại với nhau….
  • Công Nghệ BlockChain, AI

Chúng ta sẽ không đề cập chuyên sâu về các công nghệ này vì đa phần trong các kỹ thuật này đều rất phức tạp.

Ngoài ra, các cơ sở dữ liệu hỗ trợ xử lí dữ liệu song song, ứng dụng hoạt động dựa trên hoạt động tìm kiếm, file system dạng rời rạc, các hệ thống điện toán đám mây (bao gồm ứng dụng, nguồn lực tính toán cũng như không gian lưu trữ) và bản thân Internet cũng là những công cụ đắc lực phục vụ cho công tác nghiên cứu và trích xuất thông tin từ “dữ liệu lớn”. Hiện nay cũng có vài cơ sở dữ liệu theo dạng quan hệ (bảng) có khả năng chứa hàng petabyte dữ liệu, chúng cũng có thể tải, quản lí, sao lưu và tối ưu hóa cách sử dụng Big Data nữa.

BIG DATA CÓ THỂ GIÚP GÌ ĐƯỢC CHO CHÚNG TA?

Tập đoàn SAS nói vấn đề thật sự không nằm ở việc bạn thu thập dữ liệu, thay vào đó, là bạn dùng Big Data để làm gì. Nhìn chung, có bốn lợi ích mà Big Data có thể mang lại: cắt giảm chi phí, giảm thời gian, tăng thời gian phát triển và tối ưu hóa sản phẩm, đồng thời hỗ trợ con người đưa ra những quyết định đúng và hợp lý hơn.

Nếu để ý một chút, bạn sẽ thấy khi mua sắm online trên eBay, Amazon hoặc những trang tương tự, trang này cũng sẽ đưa ra những sản phẩm gợi ý tiếp theo cho bạn, ví dụ khi xem điện thoại, nó sẽ gợi ý cho bạn mua thêm ốp lưng, pin dự phòng; hoặc khi mua áo thun thì sẽ có thêm gợi ý quần jean, dây nịt… Do đó, nghiên cứu được sở thích, thói quen của khách hàng cũng gián tiếp giúp doanh nghiệp bán được nhiều hàng hóa hơn.

Vậy những thông tin về thói quen, sở thích này có được từ đâu? Chính là từ lượng dữ liệu khổng lồ mà các doanh nghiệp thu thập trong lúc khách hàng ghé thăm và tương tác với trang web của mình. Chỉ cần doanh nghiệp biết khai thác một cách có hiệu quả Big Data thì nó không chỉ giúp tăng lợi nhuận cho chính họ mà còn tăng trải nghiệm mua sắm của người dùng, chúng ta có thể tiết kiệm thời gian hơn nhờ những lời gợi ý so với việc phải tự mình tìm kiếm.

Thảo luận về vấn đề này. 

T.me/Vozblockchain 

Bình luận facebook
Chia sẻ