머신러닝을 위한 기초 수학 및 프로그래밍 실습

머신러닝을 위한 기초 수학 및 프로그래밍 실습
수업주제 머신러닝에 필요한 기본 개념을 학습하며, 이에 대한 방법론들을 배운다. 이러한 방법론을 활용한 프로젝트들을 수업시간을 통해 프로그래밍 해보며, 자신의 프로젝트에 활용할 수 있는 역량을 증진한다.
수업 목적 및 목표 머신러닝과 인공지능 분야가 보여주고 있는 놀라운 발전의 근간에는 자연 현상을 수학 문제로 기술한 뒤 수많은 현대 수학의 도구를 이용해서 풀어낸 수학의 틀이 존재한다. 따라서 이같은 수학의 핵심 원리를 모른 채 이미 라이브러리화된 것을 단순하게 사용하여 학습하는 것으로는 한계에 봉착할 수 있다.
본 강의의 목적은 수강생이 머신러닝을 이해하는데 있어 필요한 수학을 프로그래밍과 연계하여 학습하는데 있다. 이를 위해 본 강의는, 수학의 단위 주제 강의 후 즉시 프로그래밍 실습을 통해 익히는 마이크로러닝 방식으로 운영한다. 머신러닝 알고리즘을 직접 다루지 않으나, 대수학, 미적분학, 선형대수, 기하학과 같이 머신러닝 학습 및 강좌에 필수적으로 요구되는 내용을 다루며, 수업에서 사용하는 프로그래밍 언어는 파이썬이다. 본 강의는 이공계 고교 수학 이상의 지식을 갖추고 있으나 프로그래밍 지식을 갖추고 있지 않은 학생을 주 대상으로 한다. 본 수업을 통해 머신런닝에 대해 이해하고 활용하여 사회공헌형 프로젝트를 발굴을 진행한다.
사회공헌 실천활동 분야 적정기술/제품개발, 지역사회활동, 기타
사회공헌 실천대상 기타

팀별활동내역

소속 공과대학 담당교수 김성우
활동기간 5월 23일 활동장소 신양학술회관
활동목적 사회 공헌형 프로젝트 설계 토의
활동내용 1. 사회 공헌형 프로젝트 주제 토의
2. 프로젝트 진행 사항 및 데이터셋 확보 방안 토의
활동소감 각자의 주제에 대한 토의를 통해서 본인의 아이디어에 대한 반응을 확인할 수 있었습니다. 데이터셋 확보 방안에 대해 의견을 나누어서 좀 더 다양한 데이터셋에 접근할 수 있게 되었습니다.

활동자료

소속 건축학과 담당교수 김성우
활동기간 2022년 5월 24일 활동장소 서울대 학관 카페
활동목적 머기프 프로젝트 미팅
활동내용 1. 이상헌 대선 기사 분석을 통한 승률 예측. Word to Vector을 이용하여 대선 승률과 관계된 단어 추출.
2. 최재웅 DNA computing system의 성능 판정.
3. 조희제 ­다양한 변수들을 고려한 승마 경기 승률 예측. Decision Tree를 활용해 기수와 승률 간의 관계 파악.
활동소감 두 번째 파이널 프로젝트 팀 미팅 시간을 가졌다. 비슷한 주제를 가진 사람들일 것으로 기대했지만 아쉽게도 이상헌님, 조희제님이 비슷하고 나와 유사한 사람은 없었다. 그래도 다른 분들이 어떻게 프로젝트를 준비하고 계시는지 들으면서 나도 어떻게 해야 할지 다시 한번 생각할 수 있는 자극이 되었고 다른 분들로부터 피드백을 받으면서 내가 생각하지 못한 방향에서의 관점을 제시해주신게 도움이 되었던 것 같다.

활동자료

소속 응용공학과 담당교수 김성우
활동기간 2022년 5월 24일 활동장소 서울대 입구역 스페이스 클라우드 채움
활동목적 각자의 프로젝트 주제 발표, 질문, 피드백
활동내용 각자의 프로젝트 주제에 대해 발표하고, 질의 응답과 보완 필요사항에 대해 Feedback 하였습니다.
조하준님 : 게임 상황을 데이터화 하여 최적의 결과를 도출해내는 학습 진행
황힘찬님 : 팬의 비정상(Anomaly) 상황을 찾아내는 방법에 대한 연구 진행
신현빈님 : Soft Robot의 스트레인 게이지 히스테리시스를 머신 러닝으로 찾아내는 연구 진행
유윤규 : 굴삭기 버켓의 위치를 머신 러닝으로 예측하는 연구 진행
-> 제 연구에 대해 위치를 예측하기엔 굴착기의 초기 상태에 따라 위치가 바뀔 수 있으니 속도로 접근하는게 어떻겠냐는 Feedback을 받았고 저도 동의하여 프로젝트를 방향을 수정하려 합니다.
활동소감 하는게 어떻겠냐는 Feedback을 받았고 저도 동의하여 프로젝트를 방향을 수정하려 합니다. 다른 사람에게 저의 주제를 설명하면서 제가 잘 모르고 있던 부분에 대해 알 수 있었으며 반대로 청자들이 어떤 부분에서 이해하기 어려운지를 알 수 있었습니다. 이를 참고하여 주제 수정과 청자를 위한 추가 자료 구성을 진행하려 합니다. 또한 다른 사람들의 프로젝트를 들으면서 제 프로젝트와의 차이점과 제가 부족한 포인트를 알 수 있었습니다.

활동자료

소속 재료공학부 담당교수 김성우
활동기간 2022년 5월 24일 활동장소 관정관 파스쿠치
활동목적 2차 프로젝트 진행사항 확인
활동내용 각자 아이디어를 공유했다. 이동준 학우는 시뮬레이션 상에서 물체에 일정한 힘을 가했을 때 물체의 위치변화와 회전각 변화를 예측하는 코드를 구현했다. training set은 물체들을 random하게 떨어뜨려서 얻었다. 시뮬레이션 data를 추출해서 perceptron code에 넣는 과정에서 복잡한 code가 요구되었다. 또한 직접 data를 만들다보니 시간도 소요되었다.
활동소감 image의 data를 추출하는 program인 resnet을 소개받았다. 그리고 내 아이디어에서 data를 모으는 방법에 대해 좋은 조언들을 해주었다. 적절한 Data를 모으면서 새로운 주제를 찾는게 굉장히 어려운 것 같다.

활동자료

소속 자유전공학부 담당교수 김성우
활동기간 2022년 5월 26일 활동장소 서울대학교 느티나무 도서관점
활동목적 프로젝트 주제 논의 및 구체화
활동내용 각자 생각하고 있는 프로젝트 주제를 말하고 현재 어디까지 구현했는지, 구현하면서 어려운 점을 이야기 했습니다.
활동소감 구현에 어려움을 겪는 부분을 조언해주고, 격려해주면서 프로젝트를 구체화 할 수 있었습니다. 다양한 전공의 학우들을 만나면서 더욱 좋은 아이디어가 샘솓았습니다.

활동자료

소속 치의학과 담당교수 김성우
활동기간 2022년 5월 25일 활동장소 사범대 파스쿠치
활동목적 이미지/영상 분류
활동내용 권범규: 샘플 영상들에 대하여 각 영상이 딥페이크로 인공적으로 제작된 영상인지 아닌지를 분류한다.
김동윤: 위성 사진을 활용하여 토지 종료 classification을 한다. Classification을 하기 위해 CNN을 학습 시키지 않고 이미 학습이된 CNN의 weights들로 Feature 추출하고 이에 대해 RFC실시한다. 이를 활용하여 불법 삼림 벌채 탐지기를 제작한다. 이와 연장하여 탄소배출문제, 농경지 가뭄 문제, 농업 생산률 문제에 대한 데이터 기반(위성 사진 Classifier의 도움을 받아) 해결책을 제공한다.
서진규: 주어진 곤충 이미지가 어느 종에 해당하는 곤충인지 분류한다.
황유빈: 여러 가지 과일 사진을 주고 특정 과일을 분류한다.
활동소감 김동윤: 조원들의 프로젝트 아이디어를 들어볼 수 있어서 정말 흥미로웠고 비슷한 이미지 분석에 관한 주제이여서 관련성 좋은 조언도 듣고 서로 의견 니눌수 있어서 효과적이라고 생각한다.
권범규: 막연히 주제만을 생각해왔고 어떻게 시행할지는 막막했었는데 비슷한 고민을 하는 조원들을 통해서 의견을 나누고 새롭게 배워간 점이 많았다.
서진규: 비슷한 분야의 조원들의 조언 덕분에 프로젝트의 방향성을 잡을 수 있었고, 피드백을 통해 개선할 점을 생각해볼 수 있었다.
황유빈: 다른 조원들의 프로젝트 계획과 전략을 들어보면서 내 프로젝트를 어떻게 할지에 대해 더 생각할 수 있어서 유익했다.

활동자료

소속 전기정보공학부 담당교수 김성우
활동기간 2022년 5월 24일 활동장소 신양 머그(카페)
활동목적 최종 프로젝트 발표 전 내용 공유
활동내용 이다은 : 소리를 통해 응급 차량을 찾아내는 머신러닝
이성택 : 음성을 통해서 화자 구분하는 머신러닝
손영현 : 지구 땅 구조를 파동을 통해서 파악하는 과정에 노이즈가 많아 autoencoder로 데이터를 깔끔하게 만들 계획
이동규 : 코인이나 주식에 대해 기술적 분석과 차트 분석 중 무엇이 더 잘되는지 LSTM을 이용하여 확인할 계획
활동소감 비슷한 주제를 갖고 있는 팀원과 어떻게 데이터 preprocessing을 할지, 즉 음성 데이터를 어떻게 가공할지에 대해 자세하게 대화를 나눌 수 있어서 좋았다. 데이터의 특성에 따라 모델의 정확도가 달라질 것으로 추정되어 데이터 처리에 대한 이야기를 나누었던 것 같다. 주제가 많이 다른 조원과도 대화를 나누며 머신러닝을 접목할 수 있는 다양한 분야에 대해 들을 수 있어 의미있었다.

활동자료

소속 조선해양공학과 담당교수 김성우
활동기간 2022년 5월 23일 활동장소 파스쿠치 서울대학교점
활동목적 final project의 계획과 진행 사항
활동내용 각자의 final project의 계획과 진행 사항을 공유하였습니다. 자동 트레이딩 봇, 따릉이 수요 예측 프로그램, 중고 물품 시세 예측 프로그램, 월세 가격 예측 프로그램 4개의 미래 예측이라는 점을 토대로 서로에게 도움이 될 만한 알고리즘과 dataset을 공유하였습니다.
활동소감 예상치 못했던 새로운 dataset을 활용할 수 있는 안목을 기를 수 있는 기회가
되었습니다. 무엇보다도 모두들 비슷한 어려움을 겪고 있는 분야에서 서로의 고충을 토로하면서 각종 조언 및 아이디어를 주고 받으면서 새로운 해결책을 찾아낼 수 있는 소중한 기회가 되었습니다.

활동자료

소속 컴퓨터공학부 담당교수 김성우
활동기간 2022년 5월 24일 활동장소 500동 투썸플레이스 카페
활동목적 프로젝트 주제 소개 및 프로젝트 계획 공유
활동내용 서로 프로젝트 계획과 진척도를 공유했다. 최재훈 씨는 CNN을 이용해 흑백 이미지에 색을 칠하는 프로젝트를 하는 중이다. 황학선 씨는 실업률과 출산률 데이터를 토대로 둘의 관계를 그래프로 시각화하고, 향후 30년간 두 값의 변화를 예측하려고 한다. 황정식 씨는 개의 품종/나이/건강 등의 요소 중 안락사에 영향을 끼치는 요인을 decision tree로 찾아 안락사를 줄이고 입양율을 높이는 요인을 찾고자 했다. 본인은 고양이 사진을 넣으면 이모티콘으로 전환하는 인공지능을 U-GAT-IT 모델로 실험해보고자 한다.
활동소감 서로 아이디어를 공유하고 궁금한 점을 질문하면서 생각지 못했던 문제를 찾거나 새로운 아이디어를 얻어갈 수 있었다.

활동자료

소속 응용공학과 담당교수 김성우
활동기간 2022 5월 25일 활동장소 자하연 분수대 앞
활동목적 머신러닝을 위한 기초 수학 및 프로그래밍 실습 2차 모임
활동내용 각자 진행하고 있는 프로젝트 내용에 대해 공유하고, 서로의 피드백을 청취함
활동소감 강현우 – 휴전선이나 경계 부근에서 사람 또는 동물인지를 구별하고자 함
김민수 – 스팸메일 분류
김솔지 – 특정 단어를 기준으로 기사의 건전성을 파악
같은 수업을 들어도 서로 얘기할 기회가 없었는데 만나서 얘기하고 피드백을 듣는 과정에서 생각의 정리가 되는 시간이어서 좋았음

활동자료

소속 식물생산과학부 담당교수 김성우
활동기간 2022년 5월 24일 활동장소 학생회관스낵
활동목적 머신러닝을 이용한 개인 프로젝트 내용 공유 및 토의
활동내용 학생회관 카페에서 만나 각자의 개인 Final Project에 관한 의견을 주고받았습니다. 박종현님은 건강보험 관련해서 개인의 체중, 키, 성별 등의 데이터를 학습시켜서 건강보험료를 예측하는 모델을 설계한다고 하셨고, 박찬솔님은 영화 데이터베이스를 이용하여(장르, 러닝타임, 주연 등) 넷플릭스와 유사한 평점-기반 영화 추천 모델을 설계한다고 하셨습니다.
활동소감 1차 모임 때와는 완전히 다른 사람들을 만날 수 있어서 뜻깊은 시간이었습니다. 저번에는 제가 막내로서 활동했었는데 조장의 역할을 수행할 수 있어서 많이 배운 것 같습니다. 서로 비슷한 추천 알고리즘 및 분류 알고리즘을 사용하기에 어떤 방법을 사용하는 것이 좋을까 함께 고민했던 것이 좋았던 것 같습니다. 또한 박찬솔 님은 스위스에서 공부하다고 교환학생으로 오신 분이었는데, 수업 외적으로도 다양한 문화와 다양한 점들을 알 수 있어서 좋았습니다. 서로 피드백하며 배울 수 있었던 뜻깊은 시간이었던 것 같습니다.

활동자료