본문 바로가기

전체 글

(162)

에이전트가 강력해질수록 공격 표면도 커집니다 - 프롬프트 인젝션에 대하여 지난 1월, Anthropic이 Claude Cowork를 출시했습니다.파일을 자율적으로 분석하고 정리하는 데스크탑 에이전트입니다. 출시 4일 만에 월 20달러 Pro 플랜 전체로 확대됐습니다. 사용자들의 반응은 좋았습니다. 한 개발자는 자신의 사이트에 있는 46개의 미발행 초안을 몇 분 만에 44번의 웹 검색으로 분석했다고 공유했습니다. 사람이 했다면 오후 내내 걸렸을 작업이었습니다.출시 48시간 후, 보안 연구팀 PromptArmor가 취약점을 공개했습니다. 공격 방식은 단순합니다.공격자가 악성 명령을 숨긴 문서를 하나 만듭니다. 흰 배경에 흰 글씨, 0.1pt 줄 간격. 육안으로는 보이지 않습니다. 이 문서를 사용자가 Cowork에 연결된 폴더에 넣습니다. Cowork가 파일을 분석하는 순간, 숨겨..

에이전트가 코드를 짜는 팀에서, 엔지니어는 무엇을 해야하는가 지난 2월, OpenAI 엔지니어링 블로그에 글 하나가 올라왔습니다.제목은 "Harness Engineering: leveraging Codex in an agent-first world." 내용은 이것이었습니다.3명으로 시작한 팀이 Codex 에이전트와 함께 5개월 동안 제품을 만들었습니다.결과물은 약 100만 줄의 코드, 1,500개의 풀 리퀘스트. 그리고 이 과정에서 인간이 직접 작성한 코드는 한 줄도 없었습니다.팀은 이것을 철학으로 삼았습니다. "인간은 코드를 쓰지 않는다." 그렇다면 엔지니어는 무엇을 했을까요.처음에는 속도가 느렸습니다. 에이전트가 무능해서가 아니었습니다. 환경이 충분히 갖춰지지 않아서였습니다.에이전트는 자신이 맥락 안에서 볼 수 있는 것만 다룰 수 있습니다. Slack 스레드에..

Anthropic이 1억 달러를 기술이 아닌 파트너에게 쓰는 이유 지난 3월 12일, Anthropic이 Claude Partner Network를 출범하며 2026년 한 해 1억 달러를 투자하겠다고 발표했습니다. Accenture, Deloitte, Cognizant, Infosys 같은 대형 컨설팅 및 전문 서비스 기업들이 파트너로 참여합니다. 파트너사에게는 교육 과정, 전담 기술 지원, 공동 영업·마케팅 리소스가 제공됩니다. 첫 번째 기술 자격증인 'Claude Certified Architect'도 함께 공개됐습니다. 파트너 네트워크 가입은 무료입니다. 저는 이 발표에서 숫자보다 한 문장이 더 눈에 들어왔습니다. "Accenture는 지금 3만 명의 직원을 Claude로 교육하고 있습니다. 그게 우리가 보고 있는 수요를 따라가기 위해 필요한 규모입니다." ..

AI의 안전을 말하던 회사가 가장 파괴적인 회사가 됐습니다. 2월 23일, Anthropic이 블로그 글 하나를 올렸습니다.Claude Code로 COBOL을 현대화할 수 있다는 내용이었습니다. COBOL은 1959년에 설계된 프로그래밍 언어입니다. 오래됐지만 사라지지 않았습니다. 미국 ATM 거래의 95%, 전 세계 금융·항공·정부 시스템의 핵심 인프라가 지금도 COBOL 위에서 돌아가고 있습니다. 전 세계에 남아 있는 COBOL 코드 라인 수는 약 2,200억 줄로 추산됩니다. 그 블로그 글이 공개된 날, IBM 주가는 하루 만에 13% 하락했습니다. IBM 25년 만의 최대 낙폭이었습니다. 시가총액으로 약 310억 달러가 증발했습니다. 법률 소프트웨어 주식, 디자인 주식도 같은 기간 내리막을 걸었습니다.Anthropic이 블로그 글을 하나 올렸을 뿐이지만,그..

AI 기업이 '레드라인'을 지킨다는 것의 의미 지난 2월 27일, 미국 국방부가 Anthropic에 이례적인 '공급망 위험(Supply Chain Risk)' 지정을 내렸습니다. 통상 중국 기업이나 외국 적성국에게 붙이는 이 딱지가, 미국의 AI 스타트업에게 처음으로 적용됐습니다. 국방부와 계약을 맺은 업체들은 Claude를 사용하지 않는다는 것을 인증해야 하며, 트럼프 대통령은 Truth Social을 통해 연방 기관 전체에 Anthropic 기술 사용 중단을 지시했습니다. 발단은 Anthropic이 국방부에 요청한 두 가지 조건이었습니다. 1. Claude를 미국 시민에 대한 대규모 감시에 사용하지 말 것. 2. 자율 무기 시스템에서 인간의 판단 없이 Claude가 단독으로 결정을 내리게 하지 말 것. 국방부는 이를 거부했습니다. 사유는 간..

AI가 생각하는 과정을 보여준다는 것의 의미 OpenAI가 지난 3월 5일 GPT-5.4 Thinking을 출시하면서 한 가지 흥미로운 기능을 추가했습니다. 필요한 경우 응답을 시작하기 전에, 모델이 먼저 자신의 계획을 보여줍니다."이 문제를 어떻게 접근할지, 어떤 순서로 처리할지"를 먼저 펼쳐 놓고, 사용자가 확인한 뒤 실행하는 방식입니다.중간에 방향이 잘못됐다 싶으면, 실행 도중에도 수정할 수 있습니다. 응답을 처음부터 다시 받을 필요가 없습니다.이 기능을 사전 계획 제시(Upfront Thinking Plan)라고 부릅니다. 저는 이것이 단순한 UX 개선이 아니라고 생각합니다.얼마 전 쓴 글에서 Anthropic의 인터럽트 기반 스티어링을 소개했습니다. AI 에이전트가 모든 것을 혼자 처리하는 대신, 특정 시점에 멈추고 사람의 판단을 기다리도..

OpenAI도 보안 에이전트를 출시했습니다 - Codex Security가 의미하는 것 2월 20일, Anthropic이 Claude Code Security를 출시했습니다. 3월 6일, OpenAI가 Codex Security를 출시했습니다. 2주 간격으로 두 회사가 보안 AI 에이전트 제품을 공개했습니다. 두 제품이 해결하려는 문제는 동일합니다. 기존 보안 도구는 규칙 기반입니다. 알려진 패턴과 일치하면 취약점으로 표시하고, 그렇지 않으면 통과시킵니다. 하지만 실제로 위험한 취약점 대부분은 규칙으로 잡히지 않습니다. 비즈니스 로직의 결함, 잘못된 접근 제어, 복잡한 데이터 흐름에서 발생하기 때문입니다. 동시에 AI가 코드 생성 속도를 높이면서 새로운 문제가 생겼습니다. AI가 코드를 빠르게 만들수록, 검토해야 할 코드는 더 빠르게 쌓입니다. 보안 검토가 병목이 되고 있습니다. 두 회사 ..

AI가 버그를 찾는 시대 - Claude의 Firefox 취약점 발견이 의미하는 것 보안 연구자가 수십 년간 검토해온 코드베이스에서 AI가 20분 만에 심각한 취약점을 발견했습니다.Anthropic과 Mozilla의 협업 이야기입니다. Claude Opus 4.6은 2주 동안 Firefox 코드베이스를 분석해 22개의 CVE를 발견했고,그 중 14개는 high-severity로 분류됐습니다.이 수치는 2025년 한 해 동안 Firefox에서 패치된 high-severity 취약점의 약 5분의 1에 해당합니다. Firefox는 수억 명이 매일 사용하는 브라우저입니다.수십 년간 보안 연구자들이 검토해왔고, 지속적인 퍼징(fuzzing)과 정적 분석이 이루어진 프로젝트입니다.Anthropic이 이 프로젝트를 선택한 이유도 바로 그것입니다. Anthropic이 Firefox를 선택한 이유는 하..

이전 1 2 3 4 ··· 21 다음

티스토리툴바