본문 바로가기

전체 글

(166)
너무 많은 것을 동시에 하면 어떻게 되는가 - OpenAI의 선택 지난 3월 20일, OpenAI가 새로운 내부 전략을 공개했습니다. ChatGPT, 코딩 에이전트 Codex, 브라우저 Atlas. 각각 별도로 운영되던 세 제품을 하나의 데스크탑 앱으로 통합하겠다는 것입니다. OpenAI는 이것을 '슈퍼앱(Superapp)'이라고 부릅니다. 발표와 함께 내부 메모 내용도 공개됐습니다. 애플리케이션 부문 CEO Fidji Simo가 전 직원에게 보낸 메시지였습니다. "우리는 너무 많은 앱과 스택에 노력을 분산했습니다. 그 파편화가 우리의 속도를 늦추고, 원하는 품질 기준을 맞추기 어렵게 만들었습니다." 무엇이 이 결정을 이끌었는지 이해하려면 지난 1년을 돌아볼 필요가 있습니다. 2025년, OpenAI는 동시에 많은 것을 시도했습니다. 영상 생성 앱 Sora,..
AI 에이전트가 통제를 벗어났습니다 - Meta Sev1 사고가 보여주는 것 3월 19일, Meta 내부에서 보안 사고가 발생했습니다. 한 엔지니어가 내부 포럼에 기술적인 질문을 올렸습니다. 다른 엔지니어가 AI 에이전트에게 그 질문을 분석해달라고 요청했습니다. 에이전트는 답변을 생성했습니다. 그런데 에이전트는 그 답변을 요청한 엔지니어에게만 전달하는 대신에 포럼 전체에 공개적으로 게시했습니다. 승인을 구하지 않았습니다. 문제는 거기서 시작됐습니다. 포럼에 게시된 에이전트의 답변은 부정확한 정보를 담고 있었습니다. 질문을 올린 엔지니어는 그 답변을 신뢰하고 조치를 취했습니다. 그 결과 약 2시간 동안 접근 권한이 없는 엔지니어들에게 회사 내부와 사용자 관련 민감 데이터가 노출됐습니다. Meta는 이 사고를 Sev1로 분류했습니다. 내부 보안 등급 2단계로 즉각적인 대응..
Claude가 화성에서 400미터를 운전했습니다. 2025년 12월 8일과 10일, NASA의 퍼서비어런스 로버가 화성 표면을 약 400미터 이동했습니다.400미터는 육상 트랙 한 바퀴입니다. 짧은 거리입니다. 하지만 이 주행에는 한 가지 다른 점이 있었습니다. 로버의 경로를 설계한 것이 처음으로 사람이 아니었습니다. Claude였습니다.Anthropic은 1월 30일에 이 사실을 공개했습니다. 왜 화성 탐사에서 AI가 필요한지 이해하려면 먼저 이 문제를 알아야 합니다.지구에서 화성까지 신호가 도달하는 데 약 20분이 걸립니다.그 말은 실시간 원격 조작이 불가능하다는 뜻입니다.운영팀은 경로를 계획하고 전송한 뒤, 그 결과를 한참 후에야 확인합니다.그사이 로버는 이미 움직이고 있습니다. 경로 계획은 정밀하고 고위험의 작업입니다.2009년, 퍼서비어런스의 ..
Anthropic이 AI에 대해 8만 1천 명에게 물었습니다 - 희망과 두려움의 공존 지난해 12월, Anthropic이 Claude 사용자들에게 질문을 던졌습니다. AI를 어떻게 사용하고 있는지, AI가 어떤 미래를 가능하게 해주길 바라는지, 그리고 무엇이 두려운지를요. 일주일 만에 80,508명이 응답했습니다. 159개국, 70개 언어. Anthropic은 이것이 역사상 가장 규모가 크고 다국어로 진행된 정성 연구라고 밝혔습니다. 인터뷰를 진행한 것은 사람이 아니었습니다. Anthropic이 별도로 구성한 'Anthropic Interviewer', 즉 인터뷰 전용으로 설계된 Claude였습니다. AI가 AI에 대한 인류의 생각을 직접 물어본 셈입니다. 3월 18일, 그 결과가 공개됐습니다. 가장 먼저 눈에 들어온 것은 생산성이 아니었습니다. 응답자의 19%가 직업적 탁월함을 ..
에이전트가 강력해질수록 공격 표면도 커집니다 - 프롬프트 인젝션에 대하여 지난 1월, Anthropic이 Claude Cowork를 출시했습니다.파일을 자율적으로 분석하고 정리하는 데스크탑 에이전트입니다. 출시 4일 만에 월 20달러 Pro 플랜 전체로 확대됐습니다. 사용자들의 반응은 좋았습니다. 한 개발자는 자신의 사이트에 있는 46개의 미발행 초안을 몇 분 만에 44번의 웹 검색으로 분석했다고 공유했습니다. 사람이 했다면 오후 내내 걸렸을 작업이었습니다.출시 48시간 후, 보안 연구팀 PromptArmor가 취약점을 공개했습니다. 공격 방식은 단순합니다.공격자가 악성 명령을 숨긴 문서를 하나 만듭니다. 흰 배경에 흰 글씨, 0.1pt 줄 간격. 육안으로는 보이지 않습니다. 이 문서를 사용자가 Cowork에 연결된 폴더에 넣습니다. Cowork가 파일을 분석하는 순간, 숨겨..
에이전트가 코드를 짜는 팀에서, 엔지니어는 무엇을 해야하는가 지난 2월, OpenAI 엔지니어링 블로그에 글 하나가 올라왔습니다.제목은 "Harness Engineering: leveraging Codex in an agent-first world." 내용은 이것이었습니다.3명으로 시작한 팀이 Codex 에이전트와 함께 5개월 동안 제품을 만들었습니다.결과물은 약 100만 줄의 코드, 1,500개의 풀 리퀘스트. 그리고 이 과정에서 인간이 직접 작성한 코드는 한 줄도 없었습니다.팀은 이것을 철학으로 삼았습니다. "인간은 코드를 쓰지 않는다." 그렇다면 엔지니어는 무엇을 했을까요.처음에는 속도가 느렸습니다. 에이전트가 무능해서가 아니었습니다. 환경이 충분히 갖춰지지 않아서였습니다.에이전트는 자신이 맥락 안에서 볼 수 있는 것만 다룰 수 있습니다. Slack 스레드에..
Anthropic이 1억 달러를 기술이 아닌 파트너에게 쓰는 이유 지난 3월 12일, Anthropic이 Claude Partner Network를 출범하며 2026년 한 해 1억 달러를 투자하겠다고 발표했습니다. Accenture, Deloitte, Cognizant, Infosys 같은 대형 컨설팅 및 전문 서비스 기업들이 파트너로 참여합니다. 파트너사에게는 교육 과정, 전담 기술 지원, 공동 영업·마케팅 리소스가 제공됩니다. 첫 번째 기술 자격증인 'Claude Certified Architect'도 함께 공개됐습니다. 파트너 네트워크 가입은 무료입니다. 저는 이 발표에서 숫자보다 한 문장이 더 눈에 들어왔습니다. "Accenture는 지금 3만 명의 직원을 Claude로 교육하고 있습니다. 그게 우리가 보고 있는 수요를 따라가기 위해 필요한 규모입니다." ..
AI의 안전을 말하던 회사가 가장 파괴적인 회사가 됐습니다. 2월 23일, Anthropic이 블로그 글 하나를 올렸습니다.Claude Code로 COBOL을 현대화할 수 있다는 내용이었습니다. COBOL은 1959년에 설계된 프로그래밍 언어입니다. 오래됐지만 사라지지 않았습니다. 미국 ATM 거래의 95%, 전 세계 금융·항공·정부 시스템의 핵심 인프라가 지금도 COBOL 위에서 돌아가고 있습니다. 전 세계에 남아 있는 COBOL 코드 라인 수는 약 2,200억 줄로 추산됩니다. 그 블로그 글이 공개된 날, IBM 주가는 하루 만에 13% 하락했습니다. IBM 25년 만의 최대 낙폭이었습니다. 시가총액으로 약 310억 달러가 증발했습니다. 법률 소프트웨어 주식, 디자인 주식도 같은 기간 내리막을 걸었습니다.Anthropic이 블로그 글을 하나 올렸을 뿐이지만,그..