분류 전체보기

오답노트

Windows에서 venv 가상환경 생성, 활성화, 비활성화, 제거

가상환경 생성 .venv라는 이름으로 가상환경 만들기 python -m venv .venv 가상환경 활성화 가상환경 이름이 .venv 일 때, 아래 명령어 사용 (Windows) .venv\Scripts\activate 아래 명령어는 Linux에서 사용하는 거라고 함 source venv/bin/activate 가상환경 비활성화 deactivate 가상환경 제거 가상환경 이름이 .venv일 때, 아래 명령어 사용 rmdir /s .venv

boostcamp AI Tech/주차별 회고

부스트캠프 AI Tech 5기 7주차 회고

boostcamp AI Tech 강주형_T5008 7주차 회고 잘했던 것! 프로젝트 잘 마무리함 아쉬운 것! 조급한 마음을 가져서 더 효율성이 떨어짐 프로젝트 진행 시 사용한 Tool에 대한 이해도가 아직 떨어지는 것 같음 개선 방향 지난 회고 쭉 읽어보고 다시 마음 잡기 복습 복습 도전할 것! PyTorch Template 복습 git 복습 Notebook 환경 탈출 키워드 optuna, WandB Project Template git 회고 작성 전에 지난 주 회고를 다시 봤는데, 그때 작성한 것들을 실천하지 못한 것 같아서 많이 아쉽다. 프로젝트 개인 회고 작성하면서 마음을 다시 잡아봅시다.

boostcamp AI Tech/주차별 회고

부스트캠프 AI Tech 5기 6주차 회고

boostcamp AI Tech 강주형_T5008 6주차 회고 잘했던 것! 모각공 스터디로 공부 시간 확보 아쉬운 것! 대회에서 갈팡질팡 EDA도 해야될 거 같고.. 모델링도 해봐야 될 거 같고.. 스코어도 신경 쓰이고.. 우선순위를 정확히 세우지 못해서 비효율적으로 시간을 활용한 느낌을 받아서 많이 아쉬웠다. 데이터 전처리를 여러 방면으로 진행했는데 왜 그렇게 했는지에 대한 근거가 부족한 상태인 것 같다. 개선 방향 오늘부터 주말까지 플랜을 제대로 세워서 진행하기 EDA를 좀 더 밀도있게 진행하고 전처리 근거 세우기 도전할 것! EDA CNN_FM 모델 베이스라인 이해해보면서 모델에 맞는 데이터 추가 전처리 후 학습시켜보기 키워드 Competition FM / FFM / DeepFM / CNN_FM /..

boostcamp AI Tech/추천 시스템

[RecSys] Context-aware Recommendation

Context-aware Recommendation Context-aware Recommendation (컨텍스트 기반 추천) Context-aware → 다양한 부가정보 추천시스템에서는 유저 관련 정보, 아이템 관련 정보, 유저 - 아이템 상호작용 정보를 사용함 CF에서는 MF 기법을 활용하면서 개별 유저와 개별 아이템 간 상호작용을 2차원 행렬로 표현함 → 유저와 아이템의 부가정보 (특성)들을 추천시스템에 반영할 수 없음 (유저의 출생지, 아이템의 카테고리, ...) → 상호작용 정보가 부족하면, 즉 "cold start"에 대한 대처가 어려움 Context-aware Recommendation은 이를 해결함 → 유저, 아이템 간 상호작용 정보 뿐 아니라, 맥락(context)에 대한 정보도 함께 반..

boostcamp AI Tech/주차별 회고

부스트캠프 AI Tech 5기 5주차 회고

boostcamp AI Tech 강주형_T5008 5주차 회고 잘했던 것! 딥러닝 모델 반복적으로 봐서 최대한 이해하려고 노력함 아쉬운 것! 지난 주 대비해서 생활 밸런스가 좀 무너짐 각 일정에 대해 시간 분배가 아쉬움 개선 방향 시간표 처음부터 다시 짜보기 도전할 것! 이번주에 학습한 모델들 총 리뷰 키워드 RecSys with DL 강의 수가 많지 않아서 수강에는 부담이 없었지만, 소개하는 내용(모델)들을 100% 이해하기에 어려움이 많았다. 그래도 반복적으로 보다보면 조금씩 이해가 되는 걸 느껴서 조금 지루하더라도 여러 번 반복해서 학습해야겠다. 주말에는 이번 주에 배운 추천시스템 모델 이론과 코드를 총 리뷰하고, 구인구팀에 집중해야할 것 같다. 긴 시간을 함께할 팀원을 구하는 거니까 서로에게 득이..

boostcamp AI Tech/추천 시스템

[RecSys] 추천 시스템에 Deep Learning 활용하기 2

RecSys with GNN Graph Neural Network GNN을 어떻게 추천 시스템에 적용하는지 알아보자 사용하는 이유: 1. 관계나 상호작용 같은 추상적인 개념 다루기에 적합 2. Non-Euclidean Space의 표현 및 학습 가능 (SNS 데이터, ...) Graph Neural Network: 그래프 데이터에 적용 가능한 신경망 목적: 이웃 노드들 간의 정보를 이용해서 특정 노드를 잘 표현할 수 있는 특징(벡터)을 잘 찾아내는 것 방법: 그래프 및 피쳐 데이터를 인접 행렬로 변환하여 MLP로 사용하는 방법 (Naive Approach) 등이 있음 → 단, 노드가 많아질수록 연산량이 기하급수적으로 많아지며, 노드의 순서가 바뀌면 의미가 달라질 가능성 존재 왼쪽 그래프처럼 원래 그래프는..

boostcamp AI Tech/추천 시스템

[RecSys] 추천 시스템에 Deep Learning 활용하기 1

앞서 포스팅한 내용처럼 추천 시스템에는 여러가지 이유로 고전적인 ML 모델을 주로 활용했음 실제로 현재도 ML 모델들이 많이 활용되고 있음 그럼에도 불구하고 추천시스템에서 딥러닝을 활용하는 이유 1. Nonlinear Transformation - 복잡한 user-item 상호작용을 효과적으로 모델링하고 user의 선호도 예측 (XOR 해결 가능) 2. Representation Learning - 사람이 직접 feature design 안 해도 됨, 텍스트/이미지/오디오 등 활용 가능 3. Sequence Modeling - 딥러닝은 NLP, 음성 신호 처리 등 Sequential modeling Task에 잘 적용됨 - 이는 추천 시스템에서 next-item prediction, session-bas..

boostcamp AI Tech/추천 시스템

[RecSys] Item2Vec and ANN

Item2Vec은 NLP 분야에서 활용된 Word2Vec에서 Word 대신 Item을 사용해서 추천 시스템에 적용시킨 기법이다. 따라서, Word2Vec 먼저 살펴보고, Item2Vec을 보자 Word2Vec Embedding 임베딩 주어진 데이터를 낮은 차원의 Vector로 만들어서 표현하는 방법이다. 앞서 학습한 Latent Factor Model과 비슷한 개념이다. Sparse Representaion: 아이템의 전체 가짓수와 차원 수가 동일 예) One-Hot Encoding, Mult-Hot Encoding 차원의 저주 위험이 있음 Dense Representation: 아이템의 전체 가짓수보다 훨씬 작은 차원으로 표현 예) 면도기 = [0.2, 1.4, -0.2, 0.5], 가위 = [-0.2..

boostcamp AI Tech/주차별 회고

부스트캠프 AI Tech 5기 4주차 회고

boostcamp AI Tech 강주형_T5008 4주차 회고 잘했던 것! 강의 수강 때 최대한 집중하고, 이해 안 되는 내용도 최대한 이해하기 위해 노력하고 넘어감 나름대로 강의 내용에 흥미를 붙임 정보처리기사 실기 집 앞 접수 성공함 아쉬운 것! 유산소 운동 횟수 감소.. 학습 내용을 소화하기 위한 절대적인 시간이 조금 부족했음 개선 방향 취침 시간 개선하기 평일에 약속 지양하기 도전할 것! 정보처리기사 실기 공부 시작 알고리즘 문제 풀이 조금 더 꾸준히.. 키워드 Matrix Factorization Collaborative Filtering 지난주와 비교했을 때 나름대로 집중력 있게 들어서 만족스럽다. 새로운 내용을 시작해서 그럴 수도 있을 거라고 생각해서, 강의 내용이 더 심화되더라도 지금 상태..

boostcamp AI Tech/추천 시스템

[RecSys] 추천 시스템 - 협업 필터링 (Collaborative Filtering) - MBCF

Model Based Collaborative Filtering 모델 기반 협업 필터링 NBCF와 비교 NBCF 문제 1. Sparsity: 데이터가 부족하면 추천 성능이 떨어지고, 부족하거나 없는 유저는 추천 불가능 2. Scalability: 유저와 아이템이 늘어날수록 연산량도 증가해서 시간이 오래걸림 이런 문제들을 보완하고자 MBCF는 데이터에 숨겨진 유저-아이템 관계의 잠재적 특성/패턴을 이용해서 추천 Parametric Machine Learning 사용 NBCF 대비 MBCF 장점 1. 모델 학습/서빙 유저-아이템 데이터는 학습에만 사용되고, 학습된 모델은 압축 형태로 저장 이미 학습된 모델을 통해 추천하기 때문에 서빙 속도 빠름 2. Sparsity / Scalability 문제 개선 NBC..

boostcamp AI Tech/추천 시스템

[RecSys] 추천 시스템 - 협업 필터링 (Collaborative Filtering) - NBCF

Collaborative Filtering (CF) 1. CF 문제 정의 '많은 유저들로부터 얻은 기호 정보'를 이용해 유저의 관심사를 자동으로 예측하는 방법 더 많은 유저/아이템 데이터가 축적될수록 협업의 효과는 커지고, 추천은 정확해질 것이라는 가정에서 출발 → DL에서 데이터가 많으면 좋다는 거랑 같은 의미로 봐도 됨 예시1) "노트북"을 본 유저에게 "다른 노트북 상품"들을 추천 예시2) "노트북"을 구매한 유저들이 구매한 "노트북 악세사리 상품"을 추천 CF의 최종 목적: 유저 u가 아이템 i에 부여할 평점을 예측하는 것 주어진 데이터를 활용해 유저-아이템 행렬 생성 유사도 기준을 정하고, 유저 혹은 아이템 간의 유사도를 구함 주어진 평점과 유사도를 활영하여 행렬의 비어 있는 값(평점)을 예측 ..

boostcamp AI Tech/추천 시스템

[RecSys] 추천 시스템 - TF-IDF를 활용한 컨텐츠 기반 추천

컨텐츠 기반 추천 컨텐츠 기반 추천 (Content-based Recommendation) 한 유저가 과거에 선호한 아이템과 비슷한 아이템을 그 유저에게 추천 예시 영화: 배우, 감독, 영화 장르 음악: 아티스트, 장르, 리듬, 무드 장점 1. 유저에게 추천을 할 때 다른 유저의 데이터가 필요하지 않음 2. 새로운 아이템 혹은 인기도가 낮은 아이템을 추천할 수 없음 3. 추천 아이템에 대한 설명이 가능함 단점 1. 아이템의 적합한 피쳐를 찾는 것이 어려움 → 아이템의 종류별로 부가 정보가 달라서 각각에 맞는 feature processing이 달라짐 2. 한 분야/장르의 추천 결과만 계속 나올 수 있음 (overspecialization 3. 다른 유저의 데이터를 활용할 수 없음 TF-IDF TF-IDF..

강주형
'분류 전체보기' 카테고리의 글 목록 (3 Page)