Table of contents [Show]
Giới thiệu
Thế giới dữ liệu và AI mang lại nhiều công cụ khoa học, thuật toán, quy trình… để xác định các mẫu có ý nghĩa từ dữ liệu có cấu trúc cũng như phi cấu trúc. Công việc phân tích dữ liệu đang phát triển mạnh mẽ cũng nhiều đổi mới trong lĩnh vực trí tuệ nhân tạo.
Nếu muốn có một nền tảng Data Analytics vững chắc thì bạn cần có một porfolio chứa các dự án data analytics. Vì thế trong bài viết này chúng tôi đưa ra các ý tưởng dự án data analytics phù hợp cho người mới bắt đầu, cũng như những người ở trình độ middle trở lên. Nếu là sinh viên, bạn cũng có thể áp dụng những ý tưởng đó vào dự án phân tích dữ liệu của mình.
Dự án data analytics
Dự án dễ
Fake News Detection ( phát hiện tin giả) - Nếu bạn biết python thì bạn có thể phát triển dự án phân tích dữ liệu bằng ngôn ngữ này. Dự án có thể phát hiễn những tin tức sai sự thật được tạo ra với mục đích giả.
Dự án EDA ( phân tích dữ liệu thăm dò) - Đầy là điều đầu tiên mà một nhà phân tích dữ liệu cần làm. Bạn cần xem xét dữ liệu để nhận dạng và xác định các mẫu. Sử dụng các kỹ thuật mô hình hoá dữ liệu, bạn có thể cung cấp bản tóm tắt về tính năng tổng thể của phân tích dữ liệu. EDA có thể được thực hiện với sự trợ giúp của dồ hoạ.
Sentiment analysis ( phân tích quan điểm ) - Phân tích này được sử dụng rộng rãi trong các cộng đồng trực tuyến để quản lý danh tiếng của bất kỳ thuơng hiệu nào hoặc phân tích đối thủ cạnh tranh. Trong cách phân loại này, các class là nhị phân( tích cực hay tiêu cực) hoặc nhiều hơn ( vui , buồn , tức giân)….
Color Detection Project ( dự án phát hiện màu) - Đây là một dự án phân tích dữ liệu dành cho sinh viên , nơi họ có thể xây dựng 1 interactive app để phát hiện mãu đã chọn từ hình ảnh.
Dự án trung bình
Chatbots - là một công cụ cực kỳ hữu ích trong các doanh nghiệp vì lượng lớn các truy vấn và tin nhắn của khách hàng có thể được chatbots xử lý để không làm chậm trễ các hoạt động kinh doanh. Ba trụ cột chính của việc thiết kế một chatbot là AI, Data Science và Machine Learning. Chatbots có thể được đào tạo bằng cách sử dụng mạng nơ-ron lặp lại cùng với dataset JSON. Việc triển khai chính có thể được thực hiện bằng python.
Handwritten digit recognition ( nhận dạng chữ số viết tay)- Những người đam mê Machine Learing sử dụng MNIST datasets chứa các chữ số viết tay. Bạn sử dụng mạng nơ-ron phức hợp và thực hiện dự đoán real-time các chữ số được vẽ trên graphical UI.
Gender and Age detection ( phát hiện giới tính và độ tuổi ) - Bạn có thể xây dựng dự án phân tích dữ liệu này bằng python , dự án dự đoán giới tính và tuổi tác chỉ bằng cách phân tích một hình ảnh. Bạn cần computer vision và cá nguyên tắc để thực hiện dự án này.
Dự án nâng cao
Movie recommendation system ( hệ thống giới thiệu phim ) - Khái niệm giới thiệu phim rất phức tạp và dựa trên phương pháp click trừu tượng. Dự án yêu cầu triển khai nhiều machine learning và truy cập vào tập dữ liệu khổng lồ bao gồm lịch sử duyệt phim, sở thích người dùng.. Bạn cần Collaborative Filtering để biết được hành vi của người dùng và R Framework , Movie dataset là lựa chọn phù hợp cho dự án như vậy.
Credit Card Fraud Detection ( phát hiện gian lận thẻ tín dung) - Một dự án phân tích dữ liệu bạn cần làm việc với decision trees , gradient boosting classfier, logistic regression và artificial nerual network. Bằng cách sử dụng tập dữ liệu giao dịch thẻ, bạn có thể phân loại cá giao dich trên thẻ tín dụng có gian lận hay không.
Customer Segmentation ( phân khúc khách hàng) - Đây là một trong những dự án phân tích dữ liệu phổ biến nhất trong các công ty vì họ cần tạo nhiều nhóm khách hàng khách hàng khác nhau khi bắt đầy bất kì chiến dịch nào.
Kết
Thông qua các dự án trên, bạn có thể thể hiện các kỹ năng của mình . Có thể bạn cho rừang các dự án phân tích cần phức tạp nhưng không phải vậy. Bạn có thể bắt đầu với cấp độ cho người mới bắt đầu và sau đó chuyển sang các cấp độ cạo hơn để xây dựng porfolio của mình.
Theo 200lab.io