간단하게 고민해 보자. 병사의 전역을 소속대 병사들의 투표로 결정한다면 과연 나갈 수 있는 사람은 몇이나 될까. 짧은 생각으로는, 보통 좋다고 생각되는 친숙한 고참들은 후임들이 더 오래 같이 있기를 원할테니 같이 있자고 하는 쪽으로 표를 던질 것이고, 흔히 꼽창이라 불리는 못된 고참들은 일찍 나가라고 할 테니 어서 나가는 쪽으로 표가 결정될 것이라 여길지도 모른다. 단순히 현 시점을 동결하여 절단하면 그런 결과가 도출될지도 모른다. 하지만 보통은 그렇게 되지는 않을 것이다. 대부분의 소비자들은 최소한의 합리는 보유하고 있으며, 최소한의 합리란 자신의 효용을 정말로 극대화하는 것이 무엇인지 고민할 능력 정도를 말한다.
논의를 시작하면서 보다 명백히 규정하도록 하자. 투표권은 매 병사에 한 표씩 주어져 있으며, 최소기간을 이수한 이상의 병사를 대상으로 한다고 하자. 일정 이상의 득표를 하지 못한 병사는 전역하지 못하며, 보통 전역투표 대상이 되는 병사는 과소하거나 최소한 과반수 이하이므로 (최소기간을 전체 기간의 50% 이상으로 하자) 필요한 최소 득표수를 2~3표 선으로 조정하면 누구나 종국에는 전역할 수 있을 것이다. 이 단순한 모형에서 필요불가결한 것은 비밀투표의 원칙이다. 담합이나 거래를 막기 위해서는 비밀투표의 원칙은 필수적이어야 한다. 생활공동체라는 군대 특성상 이는 사실상 지켜지기 힘든 원칙이지만 분석 과정에서는 일단 지켜지는 것으로 고려한다.
상식적으로 생각해 보자. 후임병들의 입장에서 고민해야할 것은 종국적으로 단 두가지이다. 오늘 내가 행사하는 한 표가 내일 나의 생활에 보다 긍정적으로 발현될 방법은 무엇인가. 그리고, 각자의 복무기간에 대한 기대값이 가급적이면 짧아질 수 있는 방법, 최소한 증가하지 않을 수 있는 방법은 무엇인가가 고민의 대상이 될 것이다.
합리적으로 볼 때 제한된 시간 내에서는 당연히 못된 고참을 일찌감치 쫓아내고 좋은 고참을 오래 오래 함께하도록 표를 던지는 것이 현명한 행위일 것이다. 하지만 장기적으로 볼 때 이같은 행위는 고참들이 후임에게 나쁜 행동을 하도록 조장하는 자살행위일 뿐이다. 고참들은 모두 자신이 더 못된 고참으로 낙인찍혀 보다 일찍 득표하기 위해 후임들을 괴롭힐 것이며, 후임들은 더 못된 고참을 다시 일찍 내보냄으로써 스스로에게 사형선고를 내리는 도장을 투표용지에 낙인찍게 된다. 어리석은 짓이다.
명백히 효율적이고 합리적인 소비자라면 못된 고참에게는 아마도 표를 던지지 않을 것이다. 단기적으로는 보다 고통이 가중되는 결과가 초래하겠지만, 2년 이상의 기간을 놓고 볼 때 표를 착한 고참에게 던지는 것이 옳은 행동일 것이다. 이때 동기 부여가 되는 것은 착한 행위며, 장기적으로 고참들의 착한 행위에 대한 확률을 증대시킨다. 이같은 풍토가 자리잡았을 때 선순환 구조가 정착할 수 있으며, 투표는 보다 더 착한 고참에게, 고참은 보다 더 착한 행위를 행할 수 있을 것이다. 득표가능한 표는 어느 정도 많이 있고, 따라서 균형이 성립한다.
하지만 초기 투표시 비합리적인 투표 행위가 연쇄되었다고 생각해보자. 악한 행위를 하는 고참을 어서 빨리 밀어내려는 욕구가 강하여 꼽창들을 먼저 밀어낼 경우에는 어떠할까. 이 역시 균형이 성립한다. 꼽창들은 보다 더 악한 행위를 하도록 강화받으며, 후임들은 이들의 가중되는 행위에 견디기 힘들 것이다. (선한 행위나 악한 행위 모두 강화받은 뒤의 수준은 최소한 초기값과 같거나 그 이상의 수준에 해당할 것이다) 따라서 꼽창에게 투표하는 행태는 이어질 것이며 개선되기 힘들다. 심지어 착하던 고참도 악한 행위를 할 것이며, 악순환이 이어진다. 명백히 이 경우도 균형이다. 어떻게 된 것일까. 왜 동일한 행위에 대해 두 개의 균형이 존재할까?
뷰티플 마인드로 유명한 수학자 내쉬가 연구한 게임이론이 바로 내쉬균형(Nash Equilbrium)이다. 내쉬균형이론의 골자는 간단하다. 상대방의 전략이 이미 결정된 것으로 가정하고 나 자신의 전략을 결정했을 때 종국적으로 도달하는 결론을 가리켜 내쉬균형이라 말한다.
조금 교과서적으로 설명해보자. (옆에 놓인 종이에 내용을 표로 그리며 적어 볼 것) 갑과 을이라는 두 사람이 각각 게임에 참여했다고 하자. 이 게임에서 갑과 을은 각각 A, B와 a, b라는 전략을 택할 수 있다. 갑이 A전략을 택하고 을이 a 전략을 택했을 때 보상을 갑이 9, 을이 7이라 하고, 갑이 B전략을 택하고 을이 a전략을 택했을 때 보상을 갑이 5, 을이 5라고 하자. 반대로 갑이 A전략 을이 b전략일 경우 보상은 각각 5, 5이며, 갑이 B전략, 을이 b전략일 때 보상은 7, 9라고 해보자. 이 경우 갑은 을의 전략이 만일 a로 주어졌다면 당연히 A 전략을 택해야 할 것이다. 반대로 을의 전략이 만일 b로 주어졌다면 또한 당연하게도 B전략을 택하는 것이 효율적일 것이다. 한편, 을은 갑의 전략이 A로 주어졌다면 a를 택할 것이며 갑의 전략이 B로 주어졌을 때는 b를 택하는 것이 합리적일 것이다. 따라서 균형점은 A, a와 B, b의 두가지가 존재하게 된다. 내쉬균형의 개괄은 이러하다.
일단 내쉬균형 상태로 들어갔을 경우 각자는 더이상 자신의 전략을 변화시킬 유인을 얻지 못한다. 자신이 다른 전략을 택했을 때 자신의 이익은 감소하게 되며, 따라서 변화는 기피된다. 내쉬균형은 항상 안정적이며, 변화를 위해서는 상당한 수준의 조건에 대한 변화가 전제될 필요가 있다. 위의 간단한 예시에서라면 갑은 최소한 2에서 4의 효용을 손실볼 각오를 하기 전에는 균형을 변화시킬 수 없다.
과점 기업이 생산에 임함에 있어서 꾸르노 균형을 지지하는 경우는, 마찬가지로 내쉬균형적이지만 단 하나의 균형점이 존재하는 경우에 해당한다. 꾸르노 균형에서 과점기업은, 서로의 생산량이 이미 확정된 것으로 가정하고 남은 시장 규모 내에서 자신의 생산량을 결정한다. 따라서 상대방은 타 기업의 생산량을 보고 자신의 생산량을 다시 조절하며, 그 결과로서 도출되는 꾸르노 점에서 양자의 생산량은 더이상 변동하지 않고 유지된다. 전형적인 내쉬균형이다. 두 기업의 생산량은 합쳐져서 마치 독점기업과 유사하게 행동하지만, 내쉬균형점을 이루기 위해 독점기업보다는 조금 과소한 생산량을 결정한다는 모형에 해당한다. (굴절수요곡선을 통한 베르뜨랑 모형은 게임이론으로 설명하기 어렵기 때문에 생략한다) 담합도 대표적인 그 한 예이다. 담합은 과점기업간의 경쟁을 통해 도출되는 내쉬균형점 이상의 수익을 거두기 위해 양 기업이 전략적으로 의사를 함께 하는 것을 말하며, 내쉬균형이 아닌 다른 지점을 지향하기 때문에 불안정하다.
내쉬균형의 특별한 형태인 우월전략균형에서는 균형점이 단 하나 존재하지만, 내쉬균형의 일반적인 형태에서는 두개의 균형점도 존재할 수 있다. 위에서 제시한 전역 투표의 경우에 성립하는 두 가지 균형이 바로 이러한 경우에 해당한다. 내쉬가 증명한 것은, 일반적으로 게임에 참가하는 참가자들이 서로 상대방의 전략과 자신의 이익을 고려해 능동적으로 선택한다면 종국적으로는 항상 균형이 존재한다는 사실이다. 우리가 논의하고자 하는 전역 투표의 경우에도 명백히 균형은 존재한다. 실제로는 장기적으로 (여기서의 장기와 단기는 고참들의 성향이 강화되어 바뀔 수 있을 정도의 기간으로 구분하도록 하자. 꼽창이 그대로 꼽창일 수 있는 고정적 기간은 단기이다) 볼 때 항상 이익은 착한 고참을 내보내는 선택이겠지만, 균형은 두가지 지점에서 각각 성립할 수 있고, 어떤 유형의 고참이 나갈지는 알 수 없다. (중도적 성향의 고참은 만기 다 채우고 질질끌다가 나갈 것이 거의 확실시 된다) 확실한 것은 이같은 내쉬 균형에서 꼽창, 아니면 선량한 고참이 가장 일찍 전역할 것이라는 사실이다. 하지만 이것이 전부는 아니다.
생각해보자. 이같은 투표로 전역을 결정할 경우, 우리는 게임 참가자들이 공정하게 게임에 참여한다는 전제 하에서 (사실상 각자간 생활은 공유하면서 투표게임에 대한 대화는 없는) 분석을 행했다. 하지만 실제 현실에서 서로간의 대화가 없을리는 없으며, 명백히 모종의 '계약'이 존재하게 될 것이다. 피투표자와 투표자 사이에서 대화가 존재하고, 담합이나 계파가 생성될 가능성은 명백하다.
이유는 단순하다. 투표권을 가진 지금의 후임도 언젠가는 피투표자가 될 것이며, 자신도 전역을 꿈꾸고 있기 때문이다. 기존에 확립된 내쉬균형에 입각해서만은, 자신이 부담해야하는 비용이 너무 막대하다. 아무나 심대한 꼽창짓을 할 수 있는 것은 아니며, 누구나 천사같은 선임이 될 수도 없다. 그런 극단항이 되기 위해서는 막대한 노력을 기울여야 하고, 상당 부분 불편함을 야기한다. 수익에 비해 비용이 막대한 현상을 보다 효율적으로 개선하기 위해서는 다른 조치가 필요하며, 담합은 따라서 형성된다.
이 사실은 또 다른 논리를 도출해 낸다. 내쉬균형은 파레토효율적이지 않을 경우가 많다. 상당수의 경우 내쉬균형은 경제학적으로 효율적이지 않을 수 있으며, 과점기업의 담합은 그 효율적인 지점을 향하는 경우가 많다. 일반적으로 담합은 선도기업에 의한 가격설정, 진입저지가격설정, 카르텔형성(하나의 독점기업처럼 행세) 등 여러가지 방식이 있을 수 있고, 특히 지금의 사례에서 적합한 담합은 카르텔 형성에 가까울 것이다. 다만 카르텔 형성시 하급자가 수익을 얻을 수 있는 것은 시계열적으로 동시적이 아니라 지연적이다. 수익은 일반적인 소득소비곡선과 마찬가지로 미래 세대로부터 도출되며, 자연히 계파가 형성될 것이다.
실제로 전역하는 이들은 이같은 계파에 소속된 이들일 것이며, 소속 계파의 내부 내쉬균형에 따라 천사나, 꼽창에 보다 가까운 이들이 될 것이다. 간단히 말해서 이같은 논의를 통해 도출할 수 있는 명백한 사실은 단지 계파가 형성될 것이라는 것, 그리고 한 극단적인 성격의 사람이 보다 쉽게 전역할 것이라는 사실 뿐이다.