분류 전체보기
-
Swin Transformer : Hierarchical Vision Transformer using Shifted Windows논문리뷰/시각지능 2022. 7. 6. 16:58
기존 Vision Transformer 문제점 1) existing Transformer-based models [64, 20], tokens are all of a fixed scale 2) this would be intractable for Transformer on high-resolution images, as the computational complexity of its self-attention is quadratic to image size. 해결방안 1) Swin Transformer constructs a hierarchical representation by starting from small-sized patches (outlined in gray) and gradually mer..
-
Multi-stage Aggregated Transformer Network for Temporal Language Localization in Videos논문리뷰/시각지능 2022. 6. 27. 13:58
Task : 자연어 문장을 통해 비디오에서 특정 순간에 대한 구간 검색 이전 방법 문제점 1) 비디오와 언어 쿼리를 활용하는데 있어서 시각-언어의 alignment 을 어떻게 효과적으로 모델링 할 것인가? 2) 비디오에서 특정 순간을 어떻게 정확하게 구간화 할 것인가? 문제해결하기 위한 방법 새로운 이미지-언어 트랜스포머 백본 모델 고안 - 시각 및 언어 시퀀스의 모든 요소를 반복 및 정렬을 가능하게 함 - 양쪽 구조를 통일하고 모달리티를 유지 - 백본에 사용되는 multi-stage aggregation 모듈 제안 (시작, 중간 및 종료 단계에 해당하는 단계별 표현 계산 후, concat하여 최종 순간 표현 형성) 1. 소개 시간에 따른 구간화는 비디오 분석에 주요하고 근본적인 태스크입니다. 기존에는 ..
-
논문 쓰기논문쓰기 2022. 4. 13. 16:02
김준석 박사님 강의 cfdkim@korea.ac.kr Introduction 표현 ~에 대한 연구는 거의 없다. There have been few studies on 연구의 목적 The object of this study was to develop 논문 표현 확인 https://scholar.google.com Google 학술 검색 거인의 어깨에 올라서서 더 넓은 세상을 바라보라 - 아이작 뉴턴 죄송합니다. 자바스크립트를 사용하도록 설정하지 않으면 일부 기능이 작동하지 않을 수 있습니다. 최적의 상태로 사용하려면 scholar.google.com 다음 내용 검색 "The object of this study was to develop " 학위 논문 -> 학술지 논문 (장려되어야 할 학문 활동, 표절..
-
고급 자연어 처리 - 오리엔테이션AI Study/자연어처리 2022. 3. 8. 11:18
Aspects of NL 1) 시간과 공간에 따라서 우리가 처리해야할 언어가 다르다. 2) 포맷에 따라 메시지가 다르다. 3) 나이에 따라 다르다. 4) Sender와 Receiver에 따라 다르다. 자연어 = (문화, 경험, 지식, .... ) *총체적인 이해가 중요 심벌만 잘 다루면 되지않는다. 자연어 처리 역사 1) 튜링이 컴퓨터 구조 제안(1940) 2) 규칙기반 AI (~1980) 체스 프로그램, 번역기등 시도 언어는 기호화 하는 순간 대부분의 정보가 사라진다. 사람은 디코딩하여 복구하여 이해한다.(같은 정보를 가진 사람은 말이 통한다.) 3) Data Driven AI (1970~) 과거에는 컴퓨터파워와 데이터 부족으로 실패함 뉴럴 네트워크, 통계 기반AI(HMM, CRF, SVM)-문제에만 ..
-
Image Retrieval on Real-life Images with Pretrained Vision-and-Language Models (ICCV, 2021)논문리뷰/시각지능 2022. 3. 4. 14:59
Abstract We extend the task of composed image retrieval, where an input query consists of an image and short textual description of how to modify the image. Existing methods have only been applied to non-complex images within narrow domains, such as fashion products, thereby limiting the scope of study on in-depth visual reasoning in rich image and language contexts. To address this issue, we co..
-
AI BM - AI전망 및 주성분분석, 군집 실습AI Study/AI 비지니스 모델 2020. 6. 16. 14:00
*딥러닝으로 이미지 처리한다고 해도, 앞단과 뒷단은 머신러닝 처리를 해야한다. 인공지능 시대 AI 기술별 매출액 전망 캐나다(인공지능의 거점 이유) ◦ 캐나다의 인공지능 생태계가 세계적인 허브로 부상하게 된 주요 요인: ① 캐나다에서 최초로 제시된 딥러닝 방법론 ② 정부의 아낌없는 지원과 인재양성 ③ 연구기술 상용화를 위한 적극적인 산·학·연 협력을 들 수 있음. -> 다양한 글로벌 기업들이 캐나다의 인공지능 관련 연구에 투자하고 있으며, 캐나다가 원천기술 확보에 적합하다는 평가 받고 있음. 캐나다 (인공지능 권위자) AI 인력분포 비지도 학습 계층적 군집, k-means군집, PCA 사례) 비지도학습 논문 배경 : 본 연구는 개인의 R&D 성과에 영향을 미치는 요인들을 분석하기 위해 개인 창의적 특성에..
-
데이터 분석을 위한 통계 수학 기초 - 엑셀 수식 활용AI Study/데이터 분석 이론 2020. 6. 2. 12:37
1. 평균 : 주어진 값들의 합을 데이터 개수로 나눈 산술 평균을 의미 엑셀 수식 : =average(데이터 범위) 2. 중앙값 : 데이터를 크기 순으로 정렬했을 때 가운데 위치하는 값 (n은 데이터 개수) 엑셀 수식 : =median(데이터 범위) 3. 최빈값 : 주어진 데이터에서 가장 많이 나오는 값 엑셀 수식 : =mode(데이터 범위) 4. 최댓값, 최솟값, 범위 최댓값 엑셀 수식 : =max(데이터 범위) 최솟값 엑셀 수식 : =min(데이터 범위) 범위 엑셀 수식 : = max(데이터 범위) - min(데이터 범위) 데이터의 특성을 파악하는 가장 좋은 방법은 그래프를 그려보는 것이다. 기초 데이터의 추세나 히스토그램 등을 그린 후에 데이터의 분포, 이상점등을 파악한 후 어떠한 데이터 분석을 할..