본문 바로가기

공부

Machine Learning Methodology & analysis 공부했다 계속해서 AI에서 사용하는 알고리즘들에 대해서 공부를 하고 있는 중이다. 항상 그러하듯이 이론과 실제는 다르다. 내가 좋아하고 자주 듣기도 하는 말이 있는데 바로 '하드웨어는 거짓말을 하지 않는다.'라는 것이다. 여기에서 하드웨어는 컴퓨터 그 자체를 의미하기도 한다. 내가 짠 프로그램이 작동하지 않는다고?? 하드웨어는 거짓말을 하지 않는다. 그냥 내가 잘못한거다!!!! 차치하고, 오늘 배운 내용들은 크게 다음과 같다. ● 데이터셋 나누기● Underfitting / Overfitting● Skewed Classes ● Precision/Recall 데이서셋을 나눈다는 것이 무슨 말인가 하면, 우리가 100개의 데이터를 가지고 있다고 하였을 때, 그것들을 모두 학습하는데 써버린다면, 지금 가지고 있는 데이..
Monte Carlo Robot Localization 파이썬 실습 지난 시간에 이러한 cyclic환경에서 움직이는 로봇에 대해서 배워 보았다. 그럼 이번에는 이를 이용한 실습을 해 보려고 한다. 우선, 가장 간소화한 시스템으로 구성해 볼 것이고, 파이썬을 사용해서 콘솔 프로그래밍을 할 것임을 밝힌다. 이 그림이 기억나는가? 로봇이 빨간색임을 감지한 상황에서 로봇이 어떤 위치에 있을 확률을 구하는 부분이었다. 여기에서 Bayes' Rule을 사용해야 함도 배워 보았다. 그럼 실질적인 코딩을 위해서 이 과정을 알고리즘으로 다시 정립해 본다면, 1. 이전 위치에서의 확률에2. 새로 감지한 색상에 따라서 확률을 각각 곱해준 뒤3. 확률의 합이 1이 되도록 normalizing한다. 이렇게 정리해 볼 수 있을 것이다. 그럼 이를 기반으로 한 다음과 같은 코드가 있을 때 1234..
Recommender System 공부했다. 대뜸 광고하는 것도 아니고, 쇼핑몰 사이트 '쿠팡'의 일부를 왜 올린거지??? 싶을까 싶다. 그런데 이는 오늘 배운 내용 Recommender System과 관련이 깊다. 글자 그대로 해석하면 '추천 시스템'이 되는데 쇼핑몰 사이트를 이용하다 보면, 내가 구입하거나 조회한 상품과 유사도가 높은 다른 제품들을 엮어서 추천을 해주는 경우도 있고, 페이스북 등을 하다 보면 내 친구들이 좋아한 페이지가 뜨면서 나에게도 구독을 요청하는 경우를 심심찮게 볼 수 있다. 이 작업들을 어떤 알바생이 고생하면서 엮어주는 것이 아니고, AI가 해주는 것인데, 오늘은 그 방법에 대해서 공부를 하였다. 출처 : ai-pm alina 이렇게 추천 시스템의 종류들을 분류할 수 있는데 그 중에서도 크게 다음 3 가지를 소개한다. ●..
Monte Carlo Robot Localization 공부했다 앞으로의 포스트는 Udacity에서 무료로 제공하는 Sebastian Thrun 교수의 Probabilistic Robotics 강좌의 공부 내용을 정리한 포스트가 되겠다. 그 목차는 다음과 같다. Lesson 1: Localization (using Histogram Filters)Lesson 2: Kalman FiltersLesson 3: Particle Filters Lesson 4: Search Lesson 5: PID Control Lesson 6: SLAM (Simultaneous Localization And Mapping) 이렇게 기초 강좌가 진행될 예정이다. 필요한 기본 지식은 다음과 같다. 영어확률과 통계에 대한 작은 지식파이썬 프로그래밍 그럼 첫 번째 강좌의 정리로 Monte Carl..
Logistic Regression 공부했다. 지난 시간 Linear Regression에 대해서 배워 보았는데, 이는 Input과 Output Data들이 있을 때, 이를 이용해서 Data들의 분포가 선형을 띠고 있을 것이라고 가정한 상태에서 각 항의 매개변수의 값의 조정을 통해서 이 분포를 실제로 이끌어내는 것이었다. 한마디로, 이미 있는 Data들을 분석하여 내가 가지고 있는 Input Data가 어떤 Output을 만들어 낼 것인가에 대한 이야기였다. 그런데 Data의 Output이 항상 가격이나, 판매량과 같은 단일 숫자가 아닐 수도 있다. 예를 들어, 꽃은 같은 품종이라도 여러 종류가 있는데, 내가 가지고 있는 이 꽃이 어느 종류에 속할 것인지 알고 싶다고 하자. 오늘은 Logistic Regression을 통해서 이 분류(Classifi..
Linear Regression 공부했다 Alina라는 회사에서 제공하는 AI 강의들을 듣고 있다. 양도 많지 않고, 파이썬 코드도 제공을 해 주어서 매일 한 챕터씩 공부를 해도 일주일 조금 걸릴 것 같다. 그럼 첫 강의로 Linear Regression을 복습해본다. 우선 결론부터 말해 보자면, 우리가 준비해 주어야 하는 것은 위의 4가지이다. Input과 Output Data는 서로 상관관계는 있지만, 인과관계는 없어야 한다. 예를 들어 위의 예시에서, 아이스크림 판매량과 해수욕장 익사자 수 사이에 무슨 관계가 있는지 살펴보자면, 아이스크림이 많이 팔렸다는 것은 그만큼 날씨가 더웠다는 것이다. 그리고, 그만큼 날이 더우면 해수욕장의 익사자 수도 많을 것이란 것을 알 수 있다. 다만, 그렇다면 아이스크림이 많이 팔려서 익사자가 많은 것인가 하..