본문 바로가기

전체 글

(146)
LLM마다 답변이 다른 이유는 사전학습과 사후학습에 있습니다. Claude, GPT, Gemini를 함께 쓰다 보면 같은 질문에도 답변의 결이 다릅니다. 처음엔 단순히 모델 성능 차이라고 생각할 수 있습니다.하지만 모델을 사용할수록 그 차이가 어디서 오는지 알 수 있습니다. 사전학습과 사후학습의 차이입니다. 사전학습(Pre-training)은 모델이 방대한 데이터를 통해 언어와 지식을 학습하는 단계입니다.사후학습(Post-training)은 그 위에서 모델이 어떻게 대답해야 하는지, 어떤 방식으로 사람과 상호작용해야 하는지를 조정하는 단계입니다.같은 규모의 사전학습을 거쳤더라도 사후학습의 방향에 따라 모델의 성격과 응답 방식이 달라집니다. GPT는 범용성이 강합니다. 다양한 태스크에 고르게 대응하도록 사후학습이 설계된 느낌입니다.특정 영역에서 두드러지기보다 어디서든..
1분기 회고를 마치며, 2분기 목표는 센토어가 되는 것 입니다. 2026년 1분기가 끝나가면서 이번 주에 팀 회고를 진행했습니다.저희 팀은 이번 분기 동안 AI-First 개발 프로세스를 도입하고 공식화하는 작업을 진행했습니다.새로운 프로세스 도입에 따라 역할별 세부 프로세스와 정책을 재정의하여 문서화하고 매뉴얼로 만들었습니다.1분기는 AI-First 개발 프로세스의 팀 내 기반을 다지는 분기였습니다.회고를 마치고 자연스럽게 2분기 방향 이야기가 나왔습니다.시스템과 프로세스를 갖췄다면, 이제 어떻게 써야 잘 활용할 수 있을까.팀원들과 함께 고민하던 중 최근 Anthropic CEO 다리오 아모데이가 뉴욕타임스 팟캐스트 인터뷰에서 한 이야기가 생각났습니다.1997년 가리 카스파로프가 딥블루에게 패배한 이후, 체스에서는 약 15~20년간 특별한 시대가 있었습니다.AI의 ..
추론 모델은 대답이 아닌 정답을 찾는다. 2024년 9월, OpenAI가 o1-preview 모델을 출시했습니다. 당시 많은 개발자들이 이 모델을 단순히 더 똑똑한 모델 정도로 받아들였습니다. 돌이켜보면 그 시점이 AI 모델의 패러다임이 바뀐 분기점이었습니다. 기존 LLM은 입력에 대해 가장 그럴듯한 다음 토큰을 예측합니다. 빠르고 효율적이지만 구조적으로 "그럴듯한 답"을 찾도록 설계된 것입니다.하지만 o1-preview는 달랐습니다. 응답 전에 내부적으로 추론 과정을 거칩니다. 틀린 경로를 되짚어 보고, 다른 전략을 시도하고, 스스로 오류를 인식합니다. 이를 Test-time Compute라고 합니다. 학습이 아닌 추론 시점에 연산을 더 투입해서 품질을 높이는 방식입니다. 기존 모델이 "이 질문에 대답은 무엇인가"를 찾는다면, 추론 모델은 "..
AI-First 개발 프로세스 도입 이후 팀 번아웃을 주의해야 한다. AI 도구가 특정 업무의 효율을 크게 높인다는 연구는 많습니다.저희 팀도 2025년 12월에 AI-First 개발 프로세스(AI를 개발 전 과정의 중심에 두는 방법론)를 공식 도입한 지 2~3개월 정도 지났는데, 구현 속도가 빨라지고 반복 작업이 줄어드는 것을 분명히 체감하고 있습니다. 그런데 Upwork Research Institute의 2024년 조사에서 흥미로운 결과가 있었습니다.AI 도구를 사용하는 직원 77%가 오히려 업무량이 늘었다고 답한 것입니다.생산성이 높아졌는데 업무량도 늘었다는 역설입니다. 저도 팀을 운영하면서 같은 현상을 경험했습니다. AI-First 개발 프로세스 도입 이전에는 구현 자체에 시간이 걸렸습니다.그 한계가 스프린트 범위를 자연스럽게 조율해줬습니다."이번 스프린트에 넣기..
XSS 패치 작업에서 놓치기 쉬운 것들 최근 알고 지내던 업체의 요청으로 XSS 취약점 패치 작업을 진행했습니다. 일회성 핫픽스가 아니라 근본적으로 코드베이스를 분석하고 문제를 막는 방향으로 작업을 진행했습니다. 서비스를 개발하다 보면 XSS 취약점 패치 작업을 마주하게 됩니다. 처음에는 단순한 시큐어 코딩 작업이라고 생각하기 쉽습니다. 취약한 입력값을 이스케이프 처리하고, 위험한 태그를 필터링하면 끝나는 작업처럼 보입니다. 그런데 공격자의 관점에서 바라보면 개발자 입장에서 쉽게 놓칠 수 있는 부분들이 추가로 눈에 들어옵니다.XSS는 크게 Stored XSS(저장형), Reflected XSS(반사형), DOM-based XSS(DOM 기반) 세 가지로 나뉩니다. 각각 발생하는 시점과 경로가 다르기 때문에 패치 방식도 달라집니다. Stored..
AI 시대가 요구하는 프로그래머, 디벨로퍼, 엔지니어의 전환 미국 노동통계국(BLS) 데이터에 따르면 2023년부터 2025년 사이미국의 프로그래머 고용은 27.5% 감소했습니다.반면 소프트웨어 디벨로퍼와 엔지니어 직군은 같은 기간 0.3% 감소에 그쳤습니다.수치만 보면 같은 개발 직군인데 왜 이렇게 다른 결과가 나왔을까,단순한 채용 시장의 흐름이 아니라 AI 도입이 가져온 직군 재편의 신호로 읽힙니다. 이 차이를 이해하려면 먼저 세 직군의 정의를 살펴볼 필요가 있습니다. 프로그래머는 주어진 스펙과 요구사항을 바탕으로 코드를 구현하는 역할입니다.무엇을 만들지는 이미 정해져 있고, 그것을 코드로 옮기는 것이 핵심 업무입니다.소프트웨어 디벨로퍼는 구현을 중심으로 하되 요구사항 분석과 기능 개발까지 포함하는 조금 더 넓은 역할입니다.기획된 내용을 바탕으로 실제 동작하는..
오프라인 B2B 비즈니스를 온라인으로 옮기며 배운 것 B2C 온라인 플랫폼에서 일할 때는 자동화된 시스템을 통해 거래의 처음부터 끝까지 처리하고, 많은 거래와 매출을 발생시키는 규모의 경제가 플랫폼이 나아가야 할 방향이라고 생각했습니다. 운영팀의 개입이 줄어들수록 더 많은 거래를 소화할 수 있고, 그것이 곧 플랫폼의 성장이라고 믿었습니다. 그런데 오프라인 기반 B2B 비즈니스를 파트너사 대상 온라인 플랫폼으로 옮기는 과정에서 기존의 생각하던 자동화 시스템의 방향이 한계가 있다는 것을 느꼈습니다. 오프라인 비즈니스는 생각했던 것보다 복잡하고 특수한 도메인이었습니다. 거래 조건이 케이스마다 다르고 관계와 신뢰를 기반으로 이루어지는 부분이 많습니다. B2C에서는 상품과 가격이 명확하게 정해져 있고 사용자가 스스로 판단해서 결제까지 이어지지만, 오프라인 기반 B2..
Claude Code Security 출시를 보며 든 생각 2008년, 저는 화이트해커로서 개발과 보안에 대한 공부를 시작했습니다. 자연스럽게 메모리 구조와 어셈블리어를 공부하게 되었고, 시스템의 취약점을 분석하고 이해하는 것에 흥미를 느꼈습니다. 시간이 많이 흘러 잊은 부분도 많지만, 그때 경험하고 학습한 보안과 시스템에 대한 이해가 이후 개발자로서 실무를 하는 과정에 큰 도움이 되었습니다. 이후 응용 소프트웨어 개발 분야로 이동하면서 익스플로잇, 취약점 분석, 시큐어 코딩 가이드 등을 서비스 개발에 자연스럽게 녹여낼 수 있었습니다. 초기에 해킹을 공부하며 익힌 공격자 관점의 시각이 실무에서 생각보다 큰 도움이 되었습니다. 2023년 GPT의 등장 이후 LLM의 발전을 지켜보며 보안과 해킹 분야에도 큰 접근성 변화가 올 것이라고 생각해왔는데, 마침 어제 Ant..

반응형