2013년 2월 13일 수요일

Twitter가 '나와 비슷한 사용자'를 추천해주는 기준은?

이번 달에 풀어보고 싶은 퀴즈가 생겼다~!

#. 들어가기 (Introduction)

트위터에서는 '나와 비슷한 사용자'를 추천해준다.


오늘 @spring_leaf 라는 트위터 이용자 분이 "나와 비슷한 사용자라니. 트윗 서버는 뭘 기준으로 추천해 주는 걸까?"라는 트윗을 남겼고 그걸 @no1_followee 라는 분이 "저도 그게 궁금"이라고 RT 해주시는 덕에 나도 멘션을 남기게 되었고 궁금증에 이렇게 글을 적게 되었다.

#. 퀴즈 문제 (Research Question)

어떤 알고리즘으로 '나와 비슷한 사용자'를 추천해주는 것일까?

#. 기준이 될 법한 요소들 (Hypothesis)

  • 팔로우 혹은 팔로잉 겹치는 정도
  • 팔로잉/팔로워 비율
  • 총 트윗 수
  • 트윗 빈도
  • 트윗 단어 유사도
  • 태그의 유사도
  • 한 트윗을 기준으로 동시에 트윗 혹은 멘션한 경우
  • ...생각나면 더 추가할 것

#. 확인 방법 (Method)

이건.. 좀 생각해봐야 할 문제인데..
일단 당분간 나를 기준으로 뜨는 유사한 사용자 DB를 축적해봐야겠다...

#. 결과 (Result & Discussion)

부디 결과를 이 달안에 얻을 수 있기를^^;

#. 더 풀어볼 문제 (Future Work)

트위터에서는 나와 비슷한 사용자 뿐만 아니라 'Who to follow(팔로우 할만한 사람)'를 보여준다. 여기에는 어떤 알고리즘을 적용했을까?

지금 생각으론 -둘 다 완전 랜덤 알고리즘을 돌린게 아니라면- 분명 다른 알고리즘을 적용했을 것 같다. 왜냐하면 겹치는 경우가 드물다. 그리고 같다면 굳이 따로 둘 필요가 없었을 테니. 그리고 서비스적인 측면에서 -개인화 검색과 개인화 추천의 차이랄까- Who to follow(팔로우 할 만한 사람)는 나와 같지 않거나 비슷하지 않아도 추천될 필요(?)가 있다.

댓글 4개:

  1. 의외로 단순할지도...

    개인적인 직관으로는
    1. 내가 팔로우한 사람이 자주 리트윗하는 글을 작성한 인물
    2. (내가 모르지만...) 나와 유사한 팔로잉을 하고 있는 사람들에게서 겹치는 인물
    3. 내가 팔로잉하는 사람들이 다수 팔로우하고 있는 인물

    정도 아닐까~?

    선정에는 나름 이유가 있는데~ 궁금하다면 토론을 해봅세 :)

    답글삭제
    답글
    1. 지금 적은건 who to follow 말하는거지? similar to you 랑은 살짝 다를거 같은데 :)
      일단 지금 관련 정보 구글링 중ㅋ 현재의 알고리즘도 궁금하지만 어떻게 하는게 좋을지도 생각해 보자!

      삭제
    2. 아~ 비슷한 사용자구나.
      난독증이네 ...
      비슷한 사용자는 그냥 단순히 팔로우하는 사람들의 유사도만 따지지 않을까? (트윗의 내용을 따지기엔 언어적한계나, 동일한 트윗에대한 반응에 대한 분석등이 여간 쉽지 않을 것 같은데, 구지 그렇게까지해서 추천을 해야하나 싶고... ^^;)
      분명 판단할 요소들은 많으니 계속 보완할 부분도 많을듯...
      항상 그렇지만 의외로 답은 가까이 있다는 것!

      삭제
    3. 답은 가까이 있다~! 좋은 지적 :)

      삭제