Skip to content

kimjhyun0627/OpenSource

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 

Repository files navigation

README

인스타그램 태그 크롤링 사이트

Linux 기반의 Shell, Python, Flask, Elasticsearch 및 Selenium, BeautifulSoup4를 사용한 웹 서비스입니다.

대중적으로 사용하는 SNS인 인스타그램(instagram)으로부터 유명인사 및 지인들의 태그(#), 계정 태그(@) 빈도수를 분석하고 저장하는 웹 서비스입니다.


실행 방법

  1. runserver.sh를 실행해 서비스 실행 시 필요한 프로그램과 모듈을 설치합니다. 이 과정에서, Elasticsearch가 실행됩니다.
    • sudo 작업을 수행하기 위해 해당 Linux 환경의 패스워드 입력이 1회 필요합니다.
  2. 추가 모듈들이 모두 설치된다면, 서비스의 메인 화면이 설치한 chrome browser를 통해 나타납니다.
  3. 검색창에 인스타그램 ID를 입력 후 버튼을 클릭합니다.
  4. 로딩 이후 해당 ID의 프로필 사진과 가장 많이 이용한 태그와 계정 태그가 이미지와 함께 나타납니다.
    • 태그(#)와 함께 보여지는 이미지는 가장 최근에 해당 태그를 사용한 게시물의 이미지입니다.
    • 계정 태그(@)와 함께 보여지는 이미지는 해당 계정의 프로필 사진입니다.
  5. 태그가 노출되는 부분의 'Learn more' 버튼을 클릭해 해당 태그가 사용된 인스타그램 게시물들을 새 창에서 보여줍니다.
  6. 계정 태그와 함께 보여지는 이미지와 글이 포함된 블록을 클릭해 해당 계정에 대한 검색을 이어나갈 수 있습니다.
  7. 같은 인스타그램 ID에 대한 두 번째 검색부터는, Elasticsearch에 저장한 값을 불러오는 방법을 통해 검색 시간을 단축합니다.
  8. 메인 화면 아래 위치한 블록들을 통해, Elasticsearch에 저장된 데이터를 기준으로 가장 많이 검색된 계정 4개의 계정 ID, 프로필 사진, 이름, 게시물의 수, 팔로워 수, 팔로잉 수가 나타납니다.
  9. 분석하고자 하는 인스타그램 계정이 비공계 계정이라면, 비공계 계정이므로 분석이 불가능함을 알리는 오류 페이지를 나타냅니다.

참고사항

  1. Python, pip, Flask, Elasticsearch 모듈은 이미 설치되어 있다고 가정하였습니다.
  2. 인스타그램 ID를 처음 검색할 때, 각 태그 별 사진을 다운로드 받는 과정에서 로딩 시간이 조금 걸리는 점 유의 바랍니다.
  3. 현재 로딩 상황은 터미널을 통해 확인할 수 있습니다.

About

OpenSource Repo.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •