본문 바로가기

AI

(12)
LLM마다 답변이 다른 이유는 사전학습과 사후학습에 있습니다. Claude, GPT, Gemini를 함께 쓰다 보면 같은 질문에도 답변의 결이 다릅니다. 처음엔 단순히 모델 성능 차이라고 생각할 수 있습니다.하지만 모델을 사용할수록 그 차이가 어디서 오는지 알 수 있습니다. 사전학습과 사후학습의 차이입니다. 사전학습(Pre-training)은 모델이 방대한 데이터를 통해 언어와 지식을 학습하는 단계입니다.사후학습(Post-training)은 그 위에서 모델이 어떻게 대답해야 하는지, 어떤 방식으로 사람과 상호작용해야 하는지를 조정하는 단계입니다.같은 규모의 사전학습을 거쳤더라도 사후학습의 방향에 따라 모델의 성격과 응답 방식이 달라집니다. GPT는 범용성이 강합니다. 다양한 태스크에 고르게 대응하도록 사후학습이 설계된 느낌입니다.특정 영역에서 두드러지기보다 어디서든..
추론 모델은 대답이 아닌 정답을 찾는다. 2024년 9월, OpenAI가 o1-preview 모델을 출시했습니다. 당시 많은 개발자들이 이 모델을 단순히 더 똑똑한 모델 정도로 받아들였습니다. 돌이켜보면 그 시점이 AI 모델의 패러다임이 바뀐 분기점이었습니다. 기존 LLM은 입력에 대해 가장 그럴듯한 다음 토큰을 예측합니다. 빠르고 효율적이지만 구조적으로 "그럴듯한 답"을 찾도록 설계된 것입니다.하지만 o1-preview는 달랐습니다. 응답 전에 내부적으로 추론 과정을 거칩니다. 틀린 경로를 되짚어 보고, 다른 전략을 시도하고, 스스로 오류를 인식합니다. 이를 Test-time Compute라고 합니다. 학습이 아닌 추론 시점에 연산을 더 투입해서 품질을 높이는 방식입니다. 기존 모델이 "이 질문에 대답은 무엇인가"를 찾는다면, 추론 모델은 "..
AI 시대가 요구하는 프로그래머, 디벨로퍼, 엔지니어의 전환 미국 노동통계국(BLS) 데이터에 따르면 2023년부터 2025년 사이미국의 프로그래머 고용은 27.5% 감소했습니다.반면 소프트웨어 디벨로퍼와 엔지니어 직군은 같은 기간 0.3% 감소에 그쳤습니다.수치만 보면 같은 개발 직군인데 왜 이렇게 다른 결과가 나왔을까,단순한 채용 시장의 흐름이 아니라 AI 도입이 가져온 직군 재편의 신호로 읽힙니다. 이 차이를 이해하려면 먼저 세 직군의 정의를 살펴볼 필요가 있습니다. 프로그래머는 주어진 스펙과 요구사항을 바탕으로 코드를 구현하는 역할입니다.무엇을 만들지는 이미 정해져 있고, 그것을 코드로 옮기는 것이 핵심 업무입니다.소프트웨어 디벨로퍼는 구현을 중심으로 하되 요구사항 분석과 기능 개발까지 포함하는 조금 더 넓은 역할입니다.기획된 내용을 바탕으로 실제 동작하는..
AI 도입의 진정한 가치는 속도 뿐만 아니라 확보된 리소스의 활용에 있다. 최근 팀 티타임에서 흥미로운 질문이 나왔습니다. 소프트웨어 개발 업무에 AI를 도입하면서 기획, 디자인, 개발 전반에 걸쳐 로우 레벨의 업무 생산성이 큰 폭으로 증대되었고, 이로 인해 확보된 시간적 리소스를 어떻게 활용하면 좋을지에 대한 질문이었습니다. 저는 이 시간적 리소스가 로스 타임이 되지 않도록 더 높은 레벨의 업무에 충분히 활용되어야 한다고 답했습니다. 스타트업이나 중소기업처럼 소규모 개발팀에서는 인력과 시간이 부족하다 보니 일정 안에 구현하는 것 자체가 목표가 되는 경우가 많았습니다. R&D나 고도화, 구조 개선에 대한 시도는 후순위로 밀리는 경우가 많았습니다. 반면 규모가 큰 개발팀은 충분한 인력과 리소스를 바탕으로 구현 업무를 소화하면서도 R&D나 고도화에 별도의 일정을 할당할 수 있었고,..