Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Ý tưởng businuess và phương pháp kỹ thuật - Lấy nội dung trang web #5

Open
baosws opened this issue Apr 1, 2017 · 1 comment
Assignees

Comments

@baosws
Copy link
Contributor

baosws commented Apr 1, 2017

"-Website sẽ tự động hàng ngày duyệt hết các trang tin trên, duyệt hết các tin đăng trong thời gian gần đây (trong vòng 1 tuần), và sẽ lấy 10% tin có số lượt xem nhiều nhất của mỗi trang web và tải về máy."
Duyệt như thế nào? (Gỉa sử duyệt được thì mỗi trang cũng có cách duyệt khác nhau, vậy làm sao cho nhanh?)
Có được quyền duyệt?

@baosws baosws changed the title Ý tưởng businuess và phương pháp kỹ thuật Ý tưởng businuess và phương pháp kỹ thuật - Lấy nội dung trang web Apr 1, 2017
@lehoanganh298
Copy link
Contributor

Duyệt tin ở giai đoạn này là duyệt sơ lược, ko duyệt từng từ trong mỗi tin, mà chỉ là lần lượt truy cập vào từng website, rồi xem những tin mới ra, chỉ xem các thông số như số lượt người xem của tin,.. rồi tải về hệ thống. Còn việc duyệt từng từ, phân tích, phận loại chi tiết mỗi tin thì làm ở bước sau, khi đã tải tin về hệ thống rồi.
Còn việc có quyền duyệt hay không thì mình nghĩ đơn giản nó duyệt giống một người sử dụng trang web bình thường, thường xuyên lên cập nhật tin mới, chỉ có khác là đây làm tự động bằng máy tính thôi, nên mình nghĩ chắc ok.
Còn cách duyệt mỗi trang mỗi khác duyệt sao cho nhanh thì chưa nghĩ ra. Mà mình có sử dụng vài extension trên chrome, nó tự động thông những tin mới trên các trang mình muốn, nên mình nghxi là cái đó làm đc

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants