본문 바로가기

반응형

Projects/MBTI

(2)
너의 MBTI는. - 1. 데이터 수집 데이터 수집 수집 대상: 네이버 카페 - MBTI 심리 카페 의 글 및 댓글 수집 방법: 게시글 번호 기준으로 전체 게시글을 4등분 한 다음 병렬적으로 데이터 수집 시행 (Selenium 사용) 수집 결과 24,286명의 유저가 작성한 글 및 댓글 총 555,145개를 수집하였다. 전처리 시 고려 사항 1. 작성자 닉네임 간혹 불분명한 MBTI를 닉네임에 작성한 경우가 있는데 (ex: INxP, INTPJ 등) 이와 같은 MBTI는 포함하지 않음 영문이 아닌 한글 (인프피, 엔팁 등)로 표기한 경우는 포함해야 함 2. 작성자가 작성하지 않은 글 가입 인사 글 등은 기본양식이 존재하고, 여기에 작성자 본인이 작성한 텍스트는 일부분에 불과함 뉴스 기사 등 인터넷에서 퍼온 내용이 글에 포함되는 경우도 마찬가지..
너의 MBTI는. - 0. 프로젝트 소개, 회고 및 향후 계획 해당 프로젝트는 23년 9월 중 진행되었던 프로젝트의 진행사항을 요약한 글로, 프로젝트 회고 및 문제점 개선을 목적으로 작성하게 되었다. 주제 선정 계기 인공지능을 통한 텍스트의 감정 분석은 비교적 흔하게 접할 수 있는 주제이다. 그렇다면 단순히 텍스트의 감정 뿐만 아니라 텍스트 작성자의 성향도 파악할 수 있지 않을까? 라는 점에 착안하게 되어 시작하였다. 만약 제작된 모델의 성능이 충분하다면 커머스 혹은 미디어의 리뷰나 댓글 등을 통해 이용자의 성향을 파악하여 알맞는 마케팅 전략을 수립하는 데 활용될 수 있을 것이라 생각했다. 그렇다면 왜 MBTI인가? 사실 MBTI는 대중적으로 많이 활용되기는 하지만 이와 동시에 상당히 많은 비판점을 가지고 있는 심리검사이기도 하다. 그럼에도 불구하고 MBTI를 타겟..

반응형