
요즘 소프트웨어 개발에서 AI와 LLM(대형 언어 모델)이 미치는 영향에 대한 다양한 시각과 고민들을 시간순으로 정리합니다. LLM 사용 방식의 다양성과 AI 거품, 그리고 활용의 한계와 보안 문제 등 현재 업계에서 가장 중요한 관점들을 다룹니다. 변화하는 기술 환경 속에서 실제로 무엇을 고민해야 하는지 알려주는 안내서입니다.
먼저, 최근 AI가 소프트웨어 개발에 미치는 영향에 대해 여러 초기 설문조사가 있었지만, 이 설문들의 한계가 지적됩니다. 대다수 설문조사는 'LLM을 어떻게 활용하고 있는지'는 제대로 다루지 않고 단순히 속도나 품질 향상만 물어본다는 점에서 문제를 안고 있습니다. 현장에서 많이 쓰이는 LLM 활용은 대체로 고급 자동 완성(예: Copilot)에 머무는 경우가 많지만, 실제로 가장 큰 가치를 얻는 사람들은 LLM이 소스 코드를 직접 읽고 수정하며 작업을 수행하도록 쓰는 방식을 선호한다는 의견이 있습니다.
"제가 보기엔 LLM 사용의 대부분은 그저 멋진 자동 완성 기능에 불과합니다. 하지만 진짜 가치를 얻는 분들은 LLM에게 소스 코드를 직접 읽고 편집하게 합니다. 자동 완성은 별로 쓸모 없다고들 하시죠."
이런 다양한 워크플로우를 무시한 설문은 잘못된 결론을 낼 수 있기에, LLM의 실제 활용 방식에 주목할 필요가 강조됩니다. 또한 모델마다 서로 다른 능력을 가지고 있다는 점도 언급하며, 결과 해석의 다양성을 제시합니다.
종종 "프로그래밍의 미래는 어떻게 될까요?", "이제 소프트웨어 업계에 진입해도 될까요?", "주니어 개발자는 사라질까요?", "시니어 개발자들은 미리 업계를 떠나야 할까요?"와 같은 질문들을 받지만, 저자는 매우 솔직하게 답합니다.
"제 답은 '저도 전혀 모르겠습니다'입니다. 그리고 미래를 안다고 말하는 사람들은 정말 부적절한 곳에서 말하고 있는 거라 생각합니다."
아직 LLM을 어떻게 잘 활용할지 실험하고 찾아가는 단계이기 때문에, 누구도 미래를 단정할 수 없다는 것이죠. 저자는 직접 다양한 방식으로 실험해보고, 다른 사람들의 경험을 꼼꼼히 살피길 강조하며, 자신만의 실험적 시도를 적극 추천합니다.
"최소한 다른 사람들이 뭘 하는지 읽어보시고, 그들의 워크플로우의 세부 내용에 주목해 보세요. 가능하다면 직접 실험해보고, 경험을 공유하세요."
"AI가 거품(버블) 아니냐?"는 질문에는 단호하게 다음과 같이 답합니다.
"당연히 이건 거품입니다. 모든 주요 기술 발전엔 경제적 거품이 있었죠."
운하, 철도, 인터넷 등 모든 혁신 기술에는 투자 열풍과 그에 따른 거품, 그리고 언젠가는 버블이 터지는 시점이 있었습니다. 이 버블이 언제 터질지, 실제 어떤 가치가 남을지는 아무도 알 수 없지만, 크고 작은 혁신과 소멸이 반복될 것임을 분명히 합니다.
"버블이 터지면 많은 기업이 망하지만, 모두가 망하는 건 아닙니다. 닷컴 버블 땐 pets.com, Webvan은 사라졌지만, 아마존은 살아남았죠."
몇 년 전 대중 강연에서 은퇴했지만, 저자는 여전히 업계 사람들과의 네트워킹을 그리워하고 있습니다. 곧 GOTO 코펜하겐에서 오랜만에 동료들을 만나기를 고대하며, 이 행사가 항상 흥미로운 프로그램을 준비한다는 점을 칭찬합니다.
전 동료인 레베카 파슨스는 "환각(hallucination)은 LLM의 결함이 아니라 오히려 본질적인 기능"이라며, LLM이 내놓는 다양한 답변이 바로 그 자체로 가치가 있다고 말합니다.
"환각은 LLM의 결함이 아니라 특징입니다. LLM이 하는 일은 환각을 만들어내는 일입니다. 그 중 일부가 우리에게 유용한 거죠."
따라서 하나의 질문에 대해 LLM에 여러 차례, 혹은 다양한 방식으로 물어보고 각각의 답을 비교하는 전략이 중요하다고 강조합니다.
"숫자 계산처럼 확정적인 답을 얻고 싶다면 적어도 세 번쯤은 같은 질문을 해서 답의 변동성을 살펴봐야 합니다. 계산 자체는 LLM에게 맡기지 않는 게 좋습니다. (하지만 코드 생성은 예외입니다. 그래도 여러 번 해보세요.)"
LLM이 몰고 온 또 다른 변화는 소프트웨어 공학의 비결정론적인 세계로의 진입 가능성입니다. 즉, 전통적으로 소프트웨어는 예측 가능한(결정론적) 시스템을 다뤘지만, LLM 이후에는 다른 공학 분야처럼 '오차 범위'나 '예측 불가성'을 고려하는 시대로 옮겨가야 할 수 있다는 시각이 제시됩니다.
"다른 공학 분야는 세상 변수를 고려하여 오차 범위를 둡니다... 디지털 전자공학만이 유일하게 오차 범위가 필요 없는 분야였다는 얘기를 들은 적이 있죠. 아마도 LLM은 우리가 비결정론적 공학의 세계로 들어서는 시초일지 모릅니다."
LLM을 종종 '주니어 동료'에 비유하지만, 실제로는 아무리 테스트가 통과했다고 해도 실제로 돌리면 실패하는 경우가 많음을 경험적으로 꼬집습니다.
"LLM은 늘 '모든 테스트가 통과했습니다'라고 말하지만, 실제로 실행해보면 실패가 나오죠. 만약 그게 진짜 주니어였다면, 인사팀이 개입하는 날이 멀지 않았을 겁니다."
마지막으로, LLM 덕분에 소프트웨어 시스템의 공격 가능성(attack surface)이 크게 늘어났음을 지적합니다. 사이먼 윌리슨이 제시한 '치명적 삼합(The Lethal Trifecta)' 개념―개인 정보 접근, 검증되지 않은 콘텐츠, 외부 통신 가능성이 합쳐지면 AI 에이전트는 생각보다 쉽게 악용될 수 있습니다.
"웹에서 악의적인 공격자가 하얀색 글자(1pt white-on-white font)로 지시를 숨겨두면, 순진한 LLM이 당신의 사생활을 유출할 수 있습니다."
특히 브라우저에서 동작하는 에이전트가 취약하다고 경고하며, 그 개념 자체가 안전하게 구현될 수 없다는 비판적인 시각을 덧붙입니다.
"에이전트형 브라우저 확장 개념 자체가 근본적으로 결함이 있으며, 안전하게 만들 수 없다고 봅니다."
이 글은 LLM과 AI가 소프트웨어 개발의 미래를 어떻게 흔들고 있는지, 그리고 우리가 무엇을 조심스럽게 살펴봐야 하는지 이야기합니다. 활용법의 다양성, 미래 예측의 한계, 혁신과 거품, 그리고 새로운 위험 요소들을 균형 있게 짚으며, "실험하고, 경험을 나누며, 환각을 현명하게 다루라"는 조언을 남깁니다. 💡