전체 글

Financial Research

2024년 글로벌 은행산업 트렌드

해외 분석기관들은 공통적으로 AI가 고객 서비스 혁신, 관리도구 개선, 프로세스 간소화 등에 중추적인 역할을 할 것으로 기대한다. 아울러 지속가능 금융, 블록체인 뱅킹, 다양한 결제시스템 개발, 서비스형 뱅킹(Saas)등 주요 화두가 될 것으로 분석했다. 포브스가 선정한 2024년 은행 및 금융서비스의 10대 트렌드 “The Biggest Banking And Financial Services Trends For 2024”, Forbes/ Bernard Marr(2023.12.11) Genereative AI in Fintech Sustainable Finance (지속가능 금융) : 신재생 에너지, 재활용 및 탄소 배출량 감소 등과 같은 그린 이니셔티브(Green initiative)에 대한 지원이 지..

Mini Project

[학부 논문] Solving ReCAPTCHA v2 Challenge using Classification-based Approach with Vision Transformer

본 논문은 2023학년 6월에 제출된 한국외국어대학교 컴퓨터공학부 졸업논문입니다. Vision Transformer를 활용한 분류 기반의 접근 방식을 통한 ReCAPTCHA v2 챌린지 해결 2023/ 5/16~6/1, 9/18~10.9 (약 1달 반) github code : https://github.com/bomishot/Solving_ReCAPTCHA_v2_Challenge_with_ViT Abstract 본 논문은 Vision Transformer(ViT)를 중심으로 한 분류 기반 접근 방식을 통해 Recaptcha 챌린지를 탐구합니다. YOLO를 활용한 기존 객체 탐지 기법의 한계를 극복하면서 뛰어난 성능 향상을 확인하였습니다. 연구 과정에서 ViT의 견고한 특성과 소형 객체 분류에서의 능력에..

Machine Learning

[CV 5] AutoEncoder

이미지를 효과적으로 압축해줄 수 있는 AutoEncoder에 대해 알아보자. 이것은 데이터 시각화를 위한 차원 축소에도 사용이 가능하다. 🌀 AutoEncoder Encoder에서 입력 데이터를 저차원 벡터로 압축한 뒤, Decoder에서 원래 크기의 데이터로 복원하는 신경망 Latent Vector 잠재 벡터. 가운데 code표시되어있는 가장 저차원의 벡터 원본 데이터보다 차원이 작으면서도, 원본 데이터의 특징을 잘 보존하고 있는 벡터 AutoEncoder는 궁극적으로 데이터의 중요 특징인, Latent vector를 잘 얻기 위한 방법이다. Latent vector를 바탕으로 다시 원본 데이터로 복원할 때에 발생하는 오류, 즉 복원 오류(Reconstruction Error)를 최소화하도록 훈련한다...

Machine Learning

[CV 4] Object Detection Model - YOLO

이전에 Object Dection 모델은 여러 객체들이 존재하는 이미지 내에서 각각의 객체가 있는 위치(Regression 문제), BBox 내의 객체에 대한 클래스 분류(Classification 문제) 수행한다고 배웠다. YOLO는 기존의 image segmentation기법, 다른 object detection모델 중 2-stage 방식인 R-CNN계열과 비교했을 때, 비슷한 성능을 기준으로 훨씬 빠른 속도를 자랑한다! You Only Look Once : 한 번만 봐도 된다! 주어진 이미지에서 Bounding Box(BBox)의 위치, classification을 한번에 수행하는 object detection model이다. 현재 YOLO v1~v8 버전까지 나와있다. 모델이 어떻게 발전했는지에 ..

Machine Learning

[CV 3] Beyond Classification - Segmentation, Object Dectection

저번에는 MLP, CNN을 이용해 입력되는 이미지에 맞는 class를 예측하는 Image Classification에 대해 공부했었다. 이번에는 자율주행을 포함해 여러 분야에서 사용되고 있는 Segmentation, Object Detection/Recognition (분할, 객체 탐지/인식) 에 대해 알아보자. 🌀 Segmentation 분할은 하나의 이미지에서 같은 의미를 가지고 있는 부분을 구분해내는 Task이다. Image classification에서는 이미지를 하나의 단위로 예측하였다면, Segmentation은 더 낮은 단위로 분류한다. 동일한 의미(사람, 자동차)마다 해당되는 픽셀이 모두 레이블링되어있는 데이터셋을 픽셀 단위에서 레이블을 예측한다. Semantic Segmentation v..

Machine Learning

[CV 2] Image Augmentation

🌀 Image Augmentation 이미지 증강 : 회전, 반전, 자르기, 밝기 혹은 채도 변화 등을 통해 데이터를 늘리는 방법 대부분 정면 데이터를 학습하기 때문에, 판단해야하는 물체가 기울어져 있거나 뒤집어진 이미지를 잘 예측하지 못한다는 취약점을 가지고 있다. 따라서, 일반화가 잘 되는 모델을 만들기 위해 학습 데이터셋에 있는 이미지를 일부러 회전하거나 기울여서 나타내는 방법을 이미지 데이터 증강이라고 한다. 이를 통해 더욱 강건(Robust)한 모델을 만들 수 있다. 과대적합은 일반적으로 훈련 데이터셋이 적을 때 발생한다. 데이터 증강을 통해 모델이 데이터의 더 많은 측면을 파악하게 되므로 일반화가 더 쉽다!!!!! tf_flowers 데이터셋 사용하기 import tensorflow_datas..

Machine Learning

[CV] CNN, Tranfer Learning

패턴이 복잡한 컬러 이미지는 MLP로는 분류가 힘들다. 이미지는 위치에 맞는 공간적인 특성을 가지고 있다. But, 배웠던 MLP에서는 flatten으로 펴준 뒤 연산하기 때문에, 이런 공간적인 특성을 잘 살려내지 못한다. CNN은 공간적 특성을 보존하며 학습할 수 있다. 합성곱 층은 이미지의 일부분을 흝으면서 연산이 진행되며 특징을 잡아내어 학습하기 때문에 층이 깊어지더라도 공간적 특성을 최대한 보존한다. 🌀 CNN의 구조 입력값이 이미지로 들어오고, (1) conv+pooling layer반복(Feature extractor), (2) 쭉 펼쳐서 fully connected layer를 만들고 softmax를 이용해 출력값냄. (classifier) 🌀 Convolution & Pooling conv..

Machine Learning

[Neural Networks 4] Hyperparameter Tuning

머신러닝에서 배웠던 cross validation, gridsearch를 통한 hyperparameter의 내용을 떠올리자! 신경망에 cross validation 적용 scikit-learn과 keras tuner를 사용하여 신경망의 hyperparmeter 탐색 실험 계획 라이브러리인 WandB의 사용법을 익히고, keras를 엮어서 사용 WandB를 사용하여 hyperparameter 탐색 적용 지금까지 다뤘던 머신러닝 알고리즘은 많아야 20개 정도의 hyperparameter만 탐색하면 됬었다. 하지만, 신경망은 층을 깊게 쌓을수록 조정해주어야 할 hyperparmeter가 훨씬 더 많아지게 된다. 머신러닝 때 사용했던 것과 거의 비슷함. (복습하는 차원에서 한 번 더 공부하자!) 🌀 신경망에 C..

bomishot
bomishot