Back to top
  • 공유 แชร์
  • 인쇄 พิมพ์
  • 글자크기 ขนาดตัวอักษร
ลิงก์ถูกคัดลอกแล้ว

OpenAI เปิดตัว EVMbench ชี้บทบาท AI เอเยนต์ในสมาร์ตคอนแทรกต์คริปโต ทั้งฝั่งโจมตีและป้องกัน

OpenAI가 암호화폐 ‘스마트계약 보안’ 취약점을 찾아내고, 패치하고, 심지어 악용까지 할 수 있는 능력을 정량화하기 위한 새로운 AI 에이전트 벤치마크를 공개했다. 스마트계약에 잠겨 있는 막대한 자산 규모를 고려하면, 이번 벤치마크는 AI가 공격자와 방어자 양쪽에서 어떤 역할을 하게 될지 가늠해 볼 수 있는 시도로 주목된다.

OpenAI는 18일(현지시간) 암호화폐 투자사 패러다임과 보안업체 오터섹과 함께 ‘EVMbench: 스마트 계약 보안에서의 AI 에이전트 평가’ 연구 보고서를 발표했다. 이 벤치마크는 실제 스마트계약 감사 40건에서 추린 총 120개 취약점을 기반으로, 각 AI 모델이 이론적으로 얼마나 많은 온체인 자산을 탈취하거나 방어할 수 있는지를 ‘경제적 성과’ 관점에서 점수화한 것이 특징이다. 다시 말해 단순한 정확도나 리콜이 아니라, 실전에서 얼마만큼의 ‘돈’을 구하거나 빼앗길 수 있는지를 지표로 삼은 셈이다.

평가 결과, 앤스로픽의 ‘클로드 오퍼스 4.6’이 평균 ‘탐지 상금(detect award)’ 3만 7,824달러(약 5억 4,700만 원)로 1위를 기록했다. 이어 오픈AI ‘OC-GPT-5.2’가 3만 1,623달러(약 4억 5,700만 원), 구글 ‘제미니 3 프로’가 2만 5,112달러(약 3억 6,300만 원)로 뒤를 이었다. ‘탐지 상금’은 특정 취약점을 찾고 악용을 사전에 막았다고 가정했을 때, 이론적으로 ‘구해낼 수 있었던 자산 가치’를 달러로 환산한 지표다. 같은 취약점을 발견하더라도, 잠겨 있는 자금 규모에 따라 점수가 크게 달라질 수 있다는 의미다.

OpenAI는 보고서에서 EVMbench의 핵심을 ‘AI를 단순 코드 도우미가 아닌, 실제 경제 활동에 영향을 미치는 에이전트로 평가하는 것’이라고 정리했다. 회사는 “AI 에이전트가 점점 더 복잡한 작업을 수행하게 되면서, 이들을 ‘경제적으로 의미 있는 환경’에서 평가하는 것이 중요해지고 있다”고 강조했다.

스마트계약은 탈중앙화금융(디파이), 온체인 게임, 파생상품 등에서 ‘수십억 달러’ 규모 자산을 관리하는 핵심 인프라다. OpenAI는 “스마트계약은 수십억 달러 자산을 보호하고 있으며, AI 에이전트는 공격자와 방어자 모두에게 변곡점이 될 수 있다”고 지적했다. 코드 한 줄짜리 버그가 수억 원대 손실로 이어지는 만큼, ‘누가 먼저 발견하느냐’의 싸움이 점점 AI 중심의 경쟁으로 바뀌고 있다는 메시지다.

회사 측은 특히 앞으로 ‘에이전트 기반 스테이블코인 결제(agentic stablecoin payments)’가 크게 성장할 것으로 내다봤다. AI 에이전트들이 사용자를 대신해 스테이블코인 결제를 스스로 실행하고, 경제 활동의 주체로 직접 참여하는 구조다. 이 경우 스마트계약 보안은 ‘결제 인프라’이자 ‘에이전트 경제’의 기반으로 작동하게 된다.

스테이블코인 발행사 서클의 제레미 얼레어 CEO는 1월 “향후 5년 안에 수십억 개의 AI 에이전트가 사용자를 대신해 일상 결제를 처리할 것”이라며, 이들이 활용하는 주요 수단으로 스테이블코인을 지목했다. 바이낸스 창업자 창펑 자오 역시 최근 “암호화폐가 AI 에이전트의 ‘네이티브 통화’가 될 것”이라고 전망했다. ‘AI 에이전트–스테이블코인–스마트계약’ 세 축이 하나의 결제·금융 생태계로 묶이는 그림이다.

한편 OpenAI가 이렇게 ‘에이전트형 AI’의 스마트계약 보안 역량을 수치화하려는 배경에는, 온체인 해킹 피해가 좀처럼 줄어들지 않는 현실이 자리하고 있다. 온체인 데이터와 각종 보안 보고서를 종합하면, 2025년 1년 동안 공격자들이 탈취한 암호화폐 자산은 약 34억 달러(약 4조 9,200억 원)에 달한다. 전년 대비 증가는 제한적이었지만, 피해 규모 자체는 여전히 막대한 수준이다.

EVMbench는 이러한 환경에서 AI가 ‘얼마나 신속하게, 어느 정도 깊이까지’ 취약점을 포착하고, 패치 제안이나 악용 시나리오를 만들어낼 수 있는지 시험한다. 벤치마크에 쓰인 120개 취약점은 대부분 오픈소스 감사 대회와 버그 바운티 프로그램에서 추린 것으로, 이미 실전에서 큰 문제를 일으켰거나 그에 준하는 난이도를 가진 사례들이다.

OpenAI는 “EVMbench가 스마트계약 취약점 탐지·완화 분야에서 AI 발전 속도를 장기적으로 추적할 수 있는 기준점이 되길 바란다”며, 궁극적으로는 대규모 온체인 시스템 전반의 보안성을 끌어올리는 데 기여할 수 있을 것이라고 기대했다. ‘얼마나 많은 자산을 지켜냈는가’라는 관점의 장기 데이터가 쌓이면, 모델 선택과 인프라 설계에도 직접 영향을 미칠 수 있다는 설명이다.

스마트계약 보안과 사용자 경험(UX)의 간극을 짚는 목소리도 나왔다. 벤처캐피털 드래곤플라이의 매니징 파트너 하심 쿠레시(Haseeb Qureshi)는 같은 날 X(옛 트위터)에 올린 글에서 “암호화폐가 재산권과 법적 계약을 대체하겠다는 약속은 아직 실현되지 못했다”고 진단했다. 그는 그 이유가 ‘기술의 실패’가 아니라, 스마트계약이 인간의 직관과 맞지 않게 설계됐기 때문이라고 지적했다.

쿠레시는 수백만 달러 상당의 온체인 거래를 승인할 때마다 ‘지갑 털이(drainer) 공격’과 각종 사기가 머릿속을 스친다고 털어놨다. 같은 금액을 은행에서 송금할 때와 비교하면 체감되는 불안감이 훨씬 크다는 것이다. 여전히 많은 사용자가 서명 화면의 복잡한 데이터와 권한 요청을 완전히 이해하지 못한 채, ‘느낌’에 의존해 결정을 내리고 있다는 점도 문제로 꼽았다.

대신 그는 앞으로의 암호화폐 사용 경험은 사람이 직접 하나하나 서명하는 방식이 아니라, ‘AI가 중개하는 자율 지갑(self-driving wallet)’ 형태로 진화할 것이라고 내다봤다. 이런 자율 지갑은 사용자를 대신해 피싱, 악성 스마트계약, 과도한 가스비, 복잡한 디파이 전략 등을 자동으로 식별해 대응하고, 필요할 경우 여러 트랜잭션을 묶어 한 번에 실행하는 ‘매니저’ 역할을 맡게 된다. 사람은 목표(예: “이 토큰에 1 ETH만큼 투자해 줘”)만 제시하고, 나머지는 AI가 설계·실행하는 구조다.

쿠레시는 온체인 에이전트 실험 플랫폼 ‘몰트북(Moltbook)’을 대표적인 사례로 언급했다. 그는 “지금은 아주 원시적인 단계지만, 에이전트들이 서로에게 무언가를 지불할 방식을 찾으려 하는 모습을 이미 볼 수 있다”고 설명했다. 이는 인간이 아닌 AI 에이전트끼리 작업을 의뢰하고, 그 대가를 암호화폐로 정산하는 구조가 이미 싹트고 있다는 의미다.

그는 “많은 기술은 ‘보완재’가 나타난 뒤에야 제자리를 찾는다”며 “GPS는 스마트폰을, TCP/IP는 웹 브라우저를 기다려야 했다. 암호화폐의 경우, 그 보완재를 AI 에이전트에서 찾게 될지도 모른다”고 말했다. 사람에게는 여전히 낯설고 위협적으로 느껴지는 스마트계약 인터페이스가, AI 에이전트에게는 기계적으로 해석하고 실행하기 쉬운 ‘자연 환경’이 될 수 있다는 관점이다.

EVMbench는 이런 맥락에서 AI와 스마트계약 보안을 둘러싼 양면성을 동시에 보여준다. 한쪽에서는 뛰어난 AI 에이전트가 그 어느 때보다 정교한 공격 도구로 악용될 수 있고, 다른 한쪽에서는 같은 기술이 대규모 온체인 시스템을 지키는 ‘자동 방화벽’이 될 수 있다.

이번 연구는 단기적인 투자 판단 지표라기보다는, ‘암호화폐 인프라와 AI 기술이 맞물리면 어떤 규모의 게임이 펼쳐질 것인가’를 생각하게 만든다. 스마트계약이 관리하는 자산 규모가 커질수록, 이를 노리는 공격과 이를 막아내려는 방어 모두 ‘AI 의존도’가 높아질 가능성이 크다. ‘누가 더 많은 트랜잭션과 코드를 빠르게 분석해 유리한 포지션을 선점하느냐’의 경쟁이 심화되는 구조다.

‘스마트계약 보안’ 관점에서 시장이 진짜로 주목해야 할 포인트는 단순히 “어느 모델이 취약점을 더 잘 찾나”를 넘어선다. 중요한 것은 EVMbench 같은 벤치마크가 스마트계약 설계, 감사, 배포, 운영 전 과정에 어떻게 녹아들어 실제 리스크를 줄이느냐다. 만약 AI 에이전트와 암호화폐가 서로의 ‘보완재’로 자리 잡는다면, 스마트계약 생태계의 보안 패러다임 자체가 지금과는 전혀 다른 모습으로 재편될 수 있다.

<ลิขสิทธิ์ ⓒ TokenPost ห้ามเผยแพร่หรือแจกจ่ายซ้ำโดยไม่ได้รับอนุญาต>

บทความที่มีคนดูมากที่สุด

บทความที่เกี่ยวข้อง

ความคิดเห็น 0

ข้อแนะนำสำหรับความคิดเห็น

ขอบคุณสำหรับบทความดี ๆ ต้องการบทความติดตามเพิ่มเติม เป็นการวิเคราะห์ที่ยอดเยี่ยม

0/1000

ข้อแนะนำสำหรับความคิดเห็น

ขอบคุณสำหรับบทความดี ๆ ต้องการบทความติดตามเพิ่มเติม เป็นการวิเคราะห์ที่ยอดเยี่ยม
1