야근을 많이 하면 생산성이 높은 걸까요? 업무생산성 제대로 측정하는 방법

작성자: 마케터 썬 | 2026. 4. 9 오전 5:46:07

야근을 많이 하면 생산성이 높은 걸까요?

업무 생산성을 제대로 측정하는 방법

회사에서 일하다 보면 한 번쯤 이런 이야기를 듣게 됩니다.

A : "나는 야근을 많이 하니 생산성이 높다.”
B : "나는 칼퇴하지만 결과를 내니까 더 생산적이다.”

여러분은 누가 더 생산적이라고 생각하시나요? 이 질문이 어려운 이유는 생각보다 단순합니다. 생산성을 바라보는 기준이 서로 다르기 때문입니다. 누가 더 오래 일했는지, 누가 더 많은 일을 처리했는지, 누가 더 좋은 결과를 냈는지처럼 여러 기준이 한데 섞여 있습니다. 결국 생산성을 무엇으로 정의하고 어떤 수준에서 측정할 것인지 정리되지 않아서 생기는 문제입니다.

이 글에서는 생산성에 대한 오해와 진실을 정리하고 실무에서 활용할 수 있는 단계별 방법까지 함께 살펴보겠습니다.
팀에서 업무생산성을 어떻게 측정하고 활용해야 할지 고민하고 있다면 이번 글을 참고해 보세요.

생산성의 정의와 일반적인 측정 방식

먼저 업무생산성의 공통된 정의부터 이해할 필요가 있습니다. 정부와 국제기구의 표준 정의에서 생산성은 대체로 산출량 대비 투입량입니다. 예를 들어 미국 노동통계국(BLS, U.S. Bureau of Labor Statistics)은 노동생산성을 실질 산출을 노동시간으로 나눈 값, 즉 시간당 산출(output per hour)로 정의합니다. 또한 국제노동기구 통계(ILOSTAT, International Labour Organization Statistics)에서도 취업자 수나 근로시간 1단위당 국내총생산(GDP, Gross Domestic Product) 같은 지표를 대표적인 노동생산성 지표로 다룹니다.

일반적인 생산성 측정의 기준

오해 1 : 산출량을 업무 목표로 정해도 될까요?

산출량 중심의 생산성 측정은 분명한 장점이 있습니다. 특히 반복 작업이나 정형화된 프로세스에서는 처리 건수, 완료량, 생산 수량 같은 산출 지표를 활용해 목표를 설정하는 방식이 효과적입니다. 산출물이 비교적 명확하고 데이터를 쉽게 기록할 수 있으며 개선 효과도 빠르게 확인할 수 있기 때문입니다.

하지만 산출량을 단일 기준으로 설정하는 방식은 한계가 명확합니다. 특히 산출과 가치가 완전히 같지 않은 직무에서는 산출량만을 핵심성과지표(KPI, Key Performance Indicator)로 사용할 때 높은 확률로 왜곡이 발생합니다. 캠벨(Campbell)의 연구 결과에서도 정량 지표가 중요한 의사결정에 강하게 연결될수록 해당 지표 자체가 왜곡되거나 조작되기 쉬워진다고 말합니다. 원래는 현실을 더 정확하게 보기 위해 만든 숫자였지만, 목표가 되는 순간 사람들은 실제 문제를 해결하기보다 숫자를 맞추는 게 집중하게 될 수 있다는 뜻입니다.

예를 들어 콜센터에서 통화 건수만을 핵심성과지표로 설정하면 상담을 서둘러 끝내는 상황이 늘어날 수 있습니다. 그 결과 재문의나 고객 불만이 늘어나도 지표상으로는 성과가 좋아 보일 수 있습니다. 처리량만을 지나치게 강조한 탓에 질적인 향상, 고객 경험처럼 더 중요한 요소가 뒤로 밀려버리는 상황이 발생하는 것입니다.

오해 2 : 개인의 생산성을 더하면 팀의 생산성이 될까요?

회사에서 자주 발생하는 또 하나의 문제는 조직 수준의 지표를 개인 평가에 그대로 적용하는 것입니다. 예를 들어 ‘우리 조직의 노동생산성이 떨어졌으니 개인의 생산성도 낮아졌을 것이다’라고 해석하는 방식입니다. 하지만 이런 결론은 매우 위험할 수 있습니다. 경제협력개발기구(OECD)의 연구에 따르면 조직의 생산성은 개인의 능력이나 노력만으로 결정되지 않습니다. 자본, 중간투입, 조직구조, 운영 효율 등 다양한 요인이 함께 작용하기 때문입니다.

반대의 경우도 마찬가지입니다. 팀의 성과 역시 개인의 성과를 단순히 합산한 값으로 설명하기 어렵습니다. 팀 업무는 여러 단계가 연결된 흐름 안에서 이루어지기 때문에 한 사람이 많은 일을 처리하더라도 다음 단계에서 지연되면 팀 전체 업무 속도가 느려질 수 있습니다.

이런 상황은 리틀의 법칙(Little’s Law)으로도 설명할 수 있습니다. 리틀의 법칙은 시스템 안에서 동시에 진행 중인 일의 양(WIP, Work In Progress)이 많아질수록 전체 체류시간도 함께 늘어날 수 있음을 보여줍니다. 일이 많이 들어오더라도 그만큼 빠르게 처리하지 못하면 시스템 안의 대기량이 늘어나고 전체 처리 시간도 길어진다는 뜻입니다. 예를 들어 앞 단계에서 검토할 문서를 한꺼번에 많이 올려도 승인 단계에서 처리할 수 있는 양이 제한돼 있다면 문서는 계속 쌓이게 됩니다.

리틀의 법칙이 시사하는 핵심은 단순합니다. 팀이 늘 바쁘게 움직이고 일이 계속 쌓여 있는 상태가 반드시 효율적인 것은 아니라는 점입니다. 특히 협업이 중요한 업무일수록 팀 생산성은 개인의 업무량보다 일의 흐름이 얼마나 매끄럽게 이어지는지에 더 크게 좌우됩니다.

리틀의 법칙(Little’s Law)

진행 중인 업무량 = 단위 시간당 처리량 × 완료까지 걸리는 평균 시간

L : 진행 중인 업무량 (Inventory/Load)
λ : 단위 시간당 처리량 (Arrival Rate/Throughput)
W : 완료까지 걸리는 평균 시간 (Waiting Time/Flow Time)

오해 3 : 아이디어의 생산성도 측정할 수 있을까요?

지식노동의 생산성을 측정하는 일이 특히 어려운 이유는 다른 업무에 비해 함께 고려해야 할 변수가 훨씬 많기 때문입니다. 여기서 말하는 지식노동(Knowledge Work)은 피터 드러커(Peter Ferdinand Drucker)가 설명한 개념으로 육체적인 노동보다 지식, 정보, 창의적 사고, 전문성을 바탕으로 가치를 만들어내는 일을 뜻합니다. 지식노동의 생산성을 판단할 때 자주 부딪히는 어려움은 크게 네 가지로 정리할 수 있습니다.

첫째, 산출의 단위를 잘못 설정하면 실제 가치와 무관한 경쟁으로 흐르기 쉽습니다. 개발자의 커밋 수, 기획자의 문서 페이지 수, 연구자의 보고서 개수 같은 지표가 대표적인 예입니다. 많이 만든다고 해서 잘 만드는 것은 아닌데, 산출량만 기준으로 삼으면 이러한 차이를 놓치기 쉽습니다.

둘째, 무형투자와 보완혁신의 영향이 큽니다. 무형투자란 설비처럼 눈에 보이는 자산이 아니라, 업무 방식, 조직 운영, 교육, 데이터 활용 체계처럼 성과를 만들어내는 기반에 투자하는 것을 말합니다. 보완혁신은 새로운 기술을 들여오는 데서 끝나는 것이 아니라, 그 기술이 제대로 작동하도록 프로세스와 역할, 협업 방식까지 함께 바꾸는 것을 뜻합니다.

그래서 새로운 기술을 도입해도 프로세스와 조직이 함께 바뀌지 않으면 효과가 바로 드러나지 않을 수 있습니다. 흔히 말하는 생산성 J-커브효과(J-curve)도 이런 맥락에서 이해할 수 있습니다. 예를 들어 인공지능을 도입했는데도 당장 생산성이 오르지 않는 이유는 기술을 활용하는 방식이 아직 충분히 정착되지 않았을 가능성을 고려해야 합니다.

셋째, 지식노동은 협업을 통해 만들어지는 경우가 많아 개인의 기여를 명확하게 나누기 어렵습니다. 기획, 데이터, 연구개발 업무가 대표적입니다. 결과는 함께 만들었지만, 각자의 기여를 숫자로 정확히 구분해 설명하는 일은 생각보다 쉽지 않습니다.

넷째, 지식노동은 정성평가와나 설문조사를 함께 사용할 수밖에 없는 경우가 많고, 이때는 편향도 함께 관리해야 합니다. 예를 들어 같은 사람이 자신의 업무 만족도와 성과를 모두 평가하면 실제보다 좋거나 나쁘게 응답할 수 있고 상사의 평가 역시 특정한 인상 하나가 전체 평가에 영향을 미칠 수 있습니다. 다시 말해 정성평가나 설문조사는 맥락을 이해하는 데에는 도움이 되지만, 그것만으로 생산성을 단정하기에는 한계가 있습니다.

그렇다면 업무생산성은 어떻게 측정해야 할까요?

생산성을 제대로 측정하려면 먼저 구분해야 할 개념이 있습니다. 바로 산출물(output) 과 성과(outcome) 입니다.

앞서 이야기했듯 산출물은 업무를 통해 직접 만들어낸 결과를 뜻합니다. 앞서 설명했듯 고객 문의를 몇 건 처리했는지, 보고서를 몇 건 작성했는지, 기능을 몇 개 배포했는지처럼 눈에 보이는 결과가 여기에 해당합니다. 쉽게 말해 무엇을 얼마나 했는가를 보여주는 지표입니다. 반면 성과는 산출물이 실제로 만들어낸 변화나 효과를 의미합니다. 고객 문의를 많이 처리한 뒤 실제 고객 만족도가 높아졌는지, 보고서를 작성한 뒤 의사결정이 더 빨라졌는지, 새로운 기능을 배포한 뒤 사용성이 좋아졌는지 같은 부분입니다. 이처럼 성과는 실제로 어떤 변화를 만들었는가를 보여줍니다.

중요한 점은 산출물이나 성과 둘 중 하나만 보면 부족하다는 것입니다. 산출물만 보면 양은 많지만 질이 떨어지는 상황을 놓칠 수 있고 성과만 보면 그 결과가 어떤 과정을 통해 만들어졌는지 파악하기 어렵습니다. 그래서 실제 생산성을 설명하려면 속도, 품질, 고객 경험, 리스크처럼 여러 요소를 함께 살펴보며 우리 업무의 성과를 가장 잘 설명할 수 있는 조합을 찾아야 합니다.

이런 관점은 여러 연구에서도 확인할 수 있습니다. 로버트 카플란과 데이비드 노턴이 제안한 균형성과표(BSC, Balanced Scorecard)는 재무 지표만으로는 조직의 성과를 충분히 설명하기 어렵다고 봤습니다. 그래서 재무 성과뿐 아니라 고객 관점, 내부 프로세스, 혁신 및 학습 같은 비재무적 요소도 함께 봐야 한다고 제안했습니다. 다시 말해 숫자 하나만 보는 것이 아니라 여러 관점을 함께 살펴봐야 조직의 실제 성과를 더 정확하게 이해할 수 있다는 뜻입니다.

비슷한 맥락에서 소프트웨어 조직에서는 데브옵스 연구 및 평가(DORA, DevOps Research and Assessment)가 제안한 지표가 자주 활용됩니다. 이 관점에서는 리드타임이나 배포 빈도 같은 속도 지표만 보는 것이 아니라, 변경 실패율이나 복구 시간 같은 안정성 지표도 함께 살펴봐야 한다고 설명합니다. 빠르게 배포하는 것만으로는 충분하지 않고 배포 후 결과가 얼마나 안정적으로 이어지는지도 함께 봐야 하기 때문입니다. 또 이런 지표를 맥락 없이 팀끼리 단순 비교하거나 개인 평가에 바로 사용하는 것은 위험하다고도 경고합니다.

예시로 보는 업무생산성 측정 방법

제조 현장을 예시로 더 자세히 설명하겠습니다. 시간당 100개를 생산했더라도 그중 10개가 불량이면 고객에게 판매할 수 있는 제품은 90개뿐입니다. 또 라인 속도를 높여 시간당 생산량이 늘어났더라도 공정능력과 공정능력지수가 떨어져 불량률이 함께 상승했다면 실제로 의미 있는 산출은 늘었다고 보기는 어렵습니다. 여기에 더해 산출량 증가가 인원 증원이나 잔업처럼 투입 증가의 결과라면 생산성 향상이라기보다 단순히 투입이 늘어난 결과에 가깝습니다.

이렇듯 실무에서는 겉으로 보이는 숫자와 실제 의미 있는 성과를 구분해서 봐야 합니다. 시간당 생산량을 생산성의 기준으로 본다면 반드시 양품 수량과 재작업, 스크랩은 물론 가능하다면 투입시간 대비 양품 산출까지 함께 봐야 합니다.

업무생산성을 측정하는 6가지 단계

이제 실제로 생산성을 측정하는 6가지 단계를 따라 업무생산성을 분석할 차례입니다. 업무생산성을 제대로 측정하려면 무엇을 위해 측정하는지, 어떤 범위에서 볼 것인지, 어떤 기준으로 해석할 것인지를 순서대로 설계해야 합니다. 일반적으로 ① 목적→ ② 측정 범위→ ③ 산출&성과 정의 → ④ 데이터 구분 → ⑤ 지표 설계 → ⑥ 파일럿&리뷰 순서로 접근하면 훨씬 이해하기 쉽고 적용하기도 수월합니다.

1. 생산성 측정의 목적 세우기

가장 먼저 해야 할 일은 지표를 왜 보는지 목적을 정하는 것입니다. 이 지표가 개선을 위한 것인지, 평가와 보상을 위한 것인지부터 구분해야 합니다. 두 가지 목적이 섞이면 지표는 쉽게 왜곡됩니다. 개선을 위해 만든 지표가 곧바로 평가 도구가 되면 사람들은 문제를 드러내기보다 숫자를 방어하는 데 집중하기 쉬워집니다. 업무 개선을 위해 공유하던 지표가 갑자기 개인 평가에 반영되기 시작하면 현장에서는 원인을 찾기보다 숫자를 좋아 보이게 만드는 데 더 집중할 수 있습니다.

2. 측정 범위 정하기

목적이 정해졌다면 이제는 어떤 범위에서 측정할지 정해야 합니다. 개인, 팀, 조직은 각각 해결해야 할 문제와 과제가 다르기 때문입니다. 조직 생산성 지표는 조직 운영과 구조를 확인하는 데 적합하지만, 개인 평가로 바로 연결하면 핵심 원인을 놓치기 쉽습니다. 반대로 개인의 처리량을 단순히 합친다고 해서 팀의 성과가 설명되는 것도 아닙니다. 협업 과정에서 발생하는 문제는 팀 단위에서 드러나는 경우가 많기 때문입니다.

3. 산출과 성과를 함께 정의하기

다음으로는 무엇을 좋은 결과로 볼 것인지 정해야 합니다. 지표를 설계할 때는 산출뿐 아니라 성과 기준도 함께 정의해야 합니다. 예를 들어 사무 업무라면 문서 수만 확인할 것이 아니라 실제 활용도나 수정 빈도까지 함께 봐야 더 현실적인 판단이 가능합니다.

4. 필요한 데이터 구분하기

어디에서 데이터를 가져올 것인지도 미리 정해야 합니다. 같은 지표라도 데이터 출처가 불분명하면 해석이 흔들리기 쉽습니다. 실무에서는 시스템 로그, 운영 기록, 설문, 인터뷰, 수기 입력 등 여러 출처의 데이터가 함께 사용됩니다. 이때 중요한 것은 어떤 데이터가 객관적인 운영 데이터인지, 어떤 데이터가 해석이 들어가는 보조 데이터인지 구분하는 것입니다.

5. 묶음 지표 설계하기

단일 KPI를 정하는보다 여러 지표를 함께 보는 방식으로 설계하는 것이 좋습니다. 속도, 품질, 가치가 함께 보이도록 묶고, 부작용을 막기 위한 가드레일 지표를 함께 두는 방식입니다. 예를 들어 생산성을 높이기 위해 처리량 지표를 사용한다면, 동시에 불량률이나 재작업률, 고객 불만, 아차사고 같은 지표도 함께 봐야 합니다. 그래야 숫자 하나를 맞추기 위해 다른 중요한 부분이 무너지는 상황을 막을 수 있습니다.

6. 작은 범위에서 먼저 시험하기

새로운 생산성 기준을 곧바로 회사 전체에 적용하는 대신 작은 범위에서 먼저 파일럿을 운영하고 리뷰하는 과정이 꼭 필요합니다. 처음부터 완벽한 지표는 드물기 때문입니다. 실제로 운영해보면 예상하지 못한 왜곡이 생기기도 하고 현장에서 받아들이는 방식이 기대와 다를 수도 있습니다. 그래서 작은 범위에서 먼저 적용해보고 실제로 개선에 도움이 되는지, 불필요한 압박을 만들고 있지는 않은지 점검하면서 조정하는 과정이 필요합니다.

업무 생산성을 높이는데 도움을 주는 다른 글도 함께 참고해 보세요.

업무자동화 전에 꼭 살펴봐야 할 프로세스 개선 5단계
업무자동화, 왜 우리 회사만 실패할까? 3가지 원인과 성공 전략
업무관리시스템 제대로 고르는 방법: 6가지 체크리스트

그래서 야근을 많이 하면 생산성이 높은 걸까요?

다시 처음의 질문으로 돌아가 보겠습니다. 야근을 많이 하면 정말 생산성이 높은 걸까요?

이제는 조금 다르게 답할 수 있습니다. 생산성은 단순히 일한 시간으로 설명할 수 없기 때문입니다. 더 중요한 것은 생산성을 떨어뜨리는 요인이 무엇인지 살펴보고 어떻게 해결할지 함께 고민하는 일입니다. 그래서 좋은 지표는 정답을 바로 알려주는 숫자가 아닌 더 나은 질문을 하게 만드는 기준에 가깝습니다. 조직 안에서 ‘왜 리드타임이 길어졌을까?’, ‘왜 같은 문제가 반복될까?’ 같은 질문이 자연스럽게 이어진다면 생산성 지표가 제대로 작동하고 있다고 볼 수 있습니다.

생산성의 개념을 이해했다면 다음으로 실제 현장에서 문제를 어떻게 풀고 있는지 살펴볼 차례입니다. 비슷한 고민을 다른 조직은 어떻게 해결했는지 궁금하다면 플렉스튜디오 고객사례집을 참고해 보세요. 사례집에서는 생산, 주문, 안전, 물류 등 다양한 분야에서 업무 프로세스를 어떻게 효율적으로 개선했는지 확인할 수 있습니다. 다른 조직의 사례를 살펴보는 것만으로도 우리 조직의 개선 방향을 더 구체적으로 그려볼 수 있습니다.

출처 및 참고자료

U.S. Bureau of Labor Statistics, Concepts: Productivity, labor productivity, and total factor productivity, n.d.
International Labour Organization, ILOSTAT, Labour productivity, n.d.
Campbell, Donald T., Assessing the Impact of Planned Social Change, 1976.
OECD, Measuring Productivity: OECD Manual, 2001.
Little, John D. C., A Proof for the Queuing Formula: L = λW, 1961.
Brynjolfsson, Erik; Rock, Daniel; Syverson, Chad, The Productivity J-Curve, 2020.
Syverson, Chad, Challenges to Mismeasurement Explanations for the US Productivity Slowdown, 2017.
Podsakoff, Philip M. et al., Common Method Biases in Behavioral Research, 2003.
Thorndike, Edward L., A Constant Error in Psychological Ratings, 1920.
Kaplan, Robert S.; Norton, David P., The Balanced Scorecard—Measures that Drive Performance, 1992.
DORA, DORA’s software delivery performance metrics, 2026.
Office for National Statistics, A guide to quality adjustment in public service productivity measures, 2019.
Drucker, Peter F., Knowledge-Worker Productivity: The Biggest Challenge, 1999.

*블로그 콘텐츠 일부에 생성형 AI가 사용되었습니다.

전체 게시물 보기