목록인공지능/LLM (4)
DevWalk

더보기 요즘 Claude, ChatGPT, Gemini 이런 애들 진짜 말 잘하죠?근데 궁금하지 않으셨나요?“아니 어떻게 이 많은 내용을 기억하고 대화에 반영하지?”“저 대화창 하나에 도대체 얼마나 많은 걸 알고 있는 거야?” 그 비밀 중 핵심 하나가 바로 이거예요:바로 MCP — Model Context Protocol.MCP란 무엇인가?Model Context Protocol은언어 모델이 “맥락(Context)”을 구성하고 유지하는 방식을 표준화한 프로토콜입니다.쉽게 말해,“지금 이 모델한테 무슨 정보가 주어졌고, 그걸 어떻게 해석하고 있는가?”이걸 정리하고 관리하는 룰북 같은 거예요.Anthropic(Claude 만든 회사)이 처음 제안했는데,이유는 간단합니다:→ “모델이 맥락을 잘 유지하려면, 맥..

1. 랭체인이란?오늘은 랭체인에 대해 알아보려한다. 랭체인은 LLM을 활용해 애플리케이션을 구축할 때 필요한 다양한 기능을 모듈화해 제공하는 프레임워크다. 단순한 텍스트 생성뿐만 아니라 여러 데이터 소스를 활용하거나 데이터베이스와 통합하고, 사용자와 상호작용하는 복잡한 시스템도 쉽게 개발할 수 있다. 이는 LLM의 잠재력을 최대한 활용할 수 있는 구조를 제공해주며, AI 애플리케이션 개발의 효율성을 크게 높인다.2. 주요 구성 요소(1) 체인(Chains)체인은 여러 작업을 순차적으로 처리하는 구조다. 입력된 데이터를 처리하고 필요한 작업을 이어서 실행할 수 있도록 체인을 구성한다. 이를 통해 복잡한 워크플로우를 쉽게 구성하고 실행할 수 있으며, 각 단계에서 LLM을 호출하거나 다른 작업을 수행할 수 있..

오늘은 Chat GPT를 하기 위해 반드시 필요한 프롬프트 엔지니어링에 대해 알아보려한다. Chat GPT의 이해는 선택이 아닌 필수이며, 그 중에서도 개발 영역과 비개발 영역의 구분 없이 모두에게 필요한 기술이 프롬프트 엔지니어링이라 생각한다. 그 이유에 대해 알아보겠다. 1. 정의 윈도우에서 명령 프롬프트 창을 열고 명령어를 실행한 적이 한 번은 있을 것이다. 명령 프롬프트 창에서 특정 지령을 내리기 위해 입력하는 텍스트를 프롬프트라고 한다. AI도 동일한 의미로 사용이 된다. AI에게 지령을 내리기 위해 입력하는 값이 프롬프트인 것이다. 또한, 이런 프롬프트를 사람이 보다 정교하게, 구체적으로 만듬으로 최적의 결과물을 만들어낼 수 있도록 하는 방법이 프롬프트 엔지니어링이다. 프롬프트(Prompt) ..

LLaMA(대형 언어 모델 메타 AI, Large Language Model Meta AI)은 Meta AI에서 2023년 2월에 발표한 대규모 언어 모델(LLM)이다. 2022년 5월에 OPT-175B를 발표했다. 그런데 OPT는 GPT3와 모델 크기는 같지만 성능이 많이 뒤쳐졌었다. 논문을 보면 이 모델이 왜 성능이 나오지 않을까에 대한 고민으로 가득하다. 그런 메타가 야심작으로 만든 모델이 Llama이다. Model Architecture LLaMA는 Villia Transformer 구조에서에 아래와 같은 변경점을 두었다. Pre-normalization (from GPT-3) 학습 안정성을 개선하기 위해 각 transformer sub-layer의 입력을 normalization함(GPT-2부터..