목록인공지능 (10)
DevWalk

더보기 요즘 Claude, ChatGPT, Gemini 이런 애들 진짜 말 잘하죠?근데 궁금하지 않으셨나요?“아니 어떻게 이 많은 내용을 기억하고 대화에 반영하지?”“저 대화창 하나에 도대체 얼마나 많은 걸 알고 있는 거야?” 그 비밀 중 핵심 하나가 바로 이거예요:바로 MCP — Model Context Protocol.MCP란 무엇인가?Model Context Protocol은언어 모델이 “맥락(Context)”을 구성하고 유지하는 방식을 표준화한 프로토콜입니다.쉽게 말해,“지금 이 모델한테 무슨 정보가 주어졌고, 그걸 어떻게 해석하고 있는가?”이걸 정리하고 관리하는 룰북 같은 거예요.Anthropic(Claude 만든 회사)이 처음 제안했는데,이유는 간단합니다:→ “모델이 맥락을 잘 유지하려면, 맥..

1. 랭체인이란?오늘은 랭체인에 대해 알아보려한다. 랭체인은 LLM을 활용해 애플리케이션을 구축할 때 필요한 다양한 기능을 모듈화해 제공하는 프레임워크다. 단순한 텍스트 생성뿐만 아니라 여러 데이터 소스를 활용하거나 데이터베이스와 통합하고, 사용자와 상호작용하는 복잡한 시스템도 쉽게 개발할 수 있다. 이는 LLM의 잠재력을 최대한 활용할 수 있는 구조를 제공해주며, AI 애플리케이션 개발의 효율성을 크게 높인다.2. 주요 구성 요소(1) 체인(Chains)체인은 여러 작업을 순차적으로 처리하는 구조다. 입력된 데이터를 처리하고 필요한 작업을 이어서 실행할 수 있도록 체인을 구성한다. 이를 통해 복잡한 워크플로우를 쉽게 구성하고 실행할 수 있으며, 각 단계에서 LLM을 호출하거나 다른 작업을 수행할 수 있..

요즘 비전 분야에서 초분광에 대한 인지도가 점점 높아지고 있다. 이는 산업 AI에서 기존의 RGB 채널이 가진 한계점을 극복하고, 사람이 보지 못했던 영역까지 볼 수 있게 해주기 때문이다. 이로 인해 산업 외에도 우주항공, 의학 등 다양한 분야에서 활용되고 있다. 그래서 이번 시간에는 초분광이 무엇인지 알아보려한다. 초분광이란?태양빛은 크게 인간의 눈에 보이는 영역과 보이지 않는 영역으로 구분할 수 있다. 인간의 눈에 보이는 영역은 가시광선 파장 영역이라고 하며, 빛의 삼원색인 적색(Red), 녹색(Green), 청색(Blue) 등을 포함하는 무지개 색상이 이에 해당한다. 보이지 않는 영역은 가시광선 파장보다 더 짧은 자외선 파장 영역과 파장이 더 긴 적외선 파장 영역으로 나뉜다. 파장 영역을 구분하는 ..

오늘은 Chat GPT를 하기 위해 반드시 필요한 프롬프트 엔지니어링에 대해 알아보려한다. Chat GPT의 이해는 선택이 아닌 필수이며, 그 중에서도 개발 영역과 비개발 영역의 구분 없이 모두에게 필요한 기술이 프롬프트 엔지니어링이라 생각한다. 그 이유에 대해 알아보겠다. 1. 정의 윈도우에서 명령 프롬프트 창을 열고 명령어를 실행한 적이 한 번은 있을 것이다. 명령 프롬프트 창에서 특정 지령을 내리기 위해 입력하는 텍스트를 프롬프트라고 한다. AI도 동일한 의미로 사용이 된다. AI에게 지령을 내리기 위해 입력하는 값이 프롬프트인 것이다. 또한, 이런 프롬프트를 사람이 보다 정교하게, 구체적으로 만듬으로 최적의 결과물을 만들어낼 수 있도록 하는 방법이 프롬프트 엔지니어링이다. 프롬프트(Prompt) ..

LLaMA(대형 언어 모델 메타 AI, Large Language Model Meta AI)은 Meta AI에서 2023년 2월에 발표한 대규모 언어 모델(LLM)이다. 2022년 5월에 OPT-175B를 발표했다. 그런데 OPT는 GPT3와 모델 크기는 같지만 성능이 많이 뒤쳐졌었다. 논문을 보면 이 모델이 왜 성능이 나오지 않을까에 대한 고민으로 가득하다. 그런 메타가 야심작으로 만든 모델이 Llama이다. Model Architecture LLaMA는 Villia Transformer 구조에서에 아래와 같은 변경점을 두었다. Pre-normalization (from GPT-3) 학습 안정성을 개선하기 위해 각 transformer sub-layer의 입력을 normalization함(GPT-2부터..

내가 얼마나 편협한 사고를 가졌는지 알 수 있었던 경진대회기존에 알고 있던 지식은 상관관계가 조금만 높은 특징이라면 데이터를 살려두는게 일반적이라 생각했는데, 이번 경진대회에서 대부분의 기존 특징을 삭제하고 폴리노미어를 사용해서 특징을 증가시킨 지금껏 전혀 보지 못했던 새로운 방식을 사용했다. 데이터의 세계는 알다가도 모르겠다

처음으로 선정한 책은 '머신러닝 시스템 설계'이다. 내가 머신러닝 엔지니어로 나아가기 위해 꼭 필요한 책이라 판단했고, DX Camp 행사에서도 관련 내용을 통해 강의를 진행한다면 많은 사람에게 도움이 되지 않을까 싶었다. 책 내용을 블로그에 요약 정리하며 머신러닝 시스템을 이해하고, 후에 강의 내용도 만들어볼 예정이다. 요약은 내 주관에 의해 중요한 부분을 위주로 정리하였다. 1.1 머신러닝을 사용해야 하는 경우 ML은 모든 문제를 해결하는 마법의 도구가 아니다. ML로 해결 가능한 문제라도 그 ML 솔루션이 최선이 아닐 수 있다. 그렇기에 프로젝트를 시작할 때 ML이 필요조건인지, 비용 효율적인지 스스로 질문해봐야한다. ML이란? 기존 데이터로부터 복잡한 패턴을 학습하고 이러한 패턴을 사용해 본 적 ..

https://wikidocs.net/31379 16-01 트랜스포머(Transformer) * 이번 챕터는 앞서 설명한 어텐션 메커니즘 챕터에 대한 사전 이해가 필요합니다. 트랜스포머(Transformer)는 2017년 구글이 발표한 논문인 Attention i… wikidocs.net

오늘은 EfficientDet에 대해 알아보려한다. EfficientDet은 Real World App에서 규모가 큰 모델, 높은 계산 비용의 한계를 극복하고 다양한 제약 조건의 환경에서 사용이 가능하도록 더 효율적인 모델의 필요성에 의해 만들어졌다. 연구진들은 높은 Accuracy와 더 좋은 efficiency를 동시에 달성할 수 있는 모델 설계를 위해 2가지 challenge를 설정하였다. Efficient multi-scale feature fusion: 일반적인 CNN 모델에서는 feature를 fusion할때 가로 세로 사이즈만 맞추고 합했는데 서로 다른 input feature들은 해상도가 다르기 때문에 그것들을 연산해서 outout을 만들어 낼때 단순히 합하는 것은 부족함을 채우기 위해 다음..

오늘은 U-Net에 대해 알아려보한다. 개요 U-Net은 MICCAI에서 'U-Net: Convolutional Networks for Biomedical Image Segmentation' 이라는 논문으로 처음으로 제안 구조로서 매우 적은 수의 학습 데이터로도 정확한 이미지 세그멘테이션 성능을 보여주었으며 ISBI 세포 추적 챌린지 2015에서 큰 점수 차이로 우승했다고 한다. U-Net은 오토인코더(autoencoder)와 같은 인코더-디코더(encoder-decoder) 기반 모델에 속한다. 아래의 오토 인코더 모델 구조를 보면 인코딩 단계에서는 입력 이미지의 특징을 파악하기 위해 채널의 수는 늘리면서 차원을 축소한다. 디코딩 단계에서는 저차원으로 인코딩된 정보만 이용하여 채널의 수를 줄이고 차원을..