요즘 인공지능(AI)이 핫합니다. 대표적인 인공지능이 필요한 분야가 챗GPT, 자율주행차, 인공지능 스피커등 많은 분야에서 사용되고 있습니다. 이를 이용한 재택 알바가 인기입니다. ‘데이터 라벨링‘이라고 하는데요. 이것을 하는 이유는 보다 정확한 정보를 이용자에게 주기 위함입니다.
데이터 라벨링이 무엇을 하는 것죠?
데이터 라벨링은 인공지능이 인지할 수 있도록 테이터를 정제하는 작업입니다. 가령 자율주행차에 쓰이는 인공지능이라면 도로에 차량이 몇대인지, 어디에 있는지 알려주는 것이 중요합니다. 정확히 분석하고 인지하는 것이 중요합니다. 만약에 인공지능이 잘못 인식하면 큰 사고로 이어지기 쉽겠죠. 그래서 데이터 라벨링을 통해 사진 혹은 영상 분석을 통해 차량은 어디에 있는지, 도로 상황은 어떤지를 알려주면 이를 참고하겠죠. 이런 작엄을 바탕으로 인공지능이 스스로 학습하여 정확한 데이터를 사람들에게 알려주게 됩니다. 이런 작업을 도와주는 것이 데이터 라벨링입니다.
데이터 라벨러는 많이 하나요?
테이터 라벨링을 하는 사람을 ‘데이터 라벨러‘라합니다. 펜데믹으로 인해 사람들이 재택업무를 많이 하면서 부업으로 데이터 라벨링을 하는 사람들이 많아졌습니다. 데이터 라벨링을 하는 사람들의 55.6%가 본업이 있는 사람들입니다. 이를 보면 직장을 다니고 있는 사람이나 은퇴를 준비하는 사람들이 이미 데이터 라벨러를 하고 있다는 것입니다. 그래도 데이터 라벨링을 할 것이 너무 많아서 데이터 라벨러가 많이 필요합니다.
데이터 라벨링은 어디서?
크라우드웍스는 국내 최대 테이터 라벨링 플랫폼입니다. 이 외에도 레이블러나 에이아이웍스 등의 플랫폼도 있습니다. 지금 국내에서 활동하는 데이터 라벨러는 50만명이 넘습니다. 많은 사람들이 테이터 라벨링을 하고 있다는 것입니다. 어느 누구나 할 수 있는 부업인데요. 한번 글을 읽으시고 시도해 보세요.
크라우드웍스 바로가기
크라우드웍스 바로가기
레이블러 바로가기
에이아이웍스 바로가기
데이터 라벨러의 업무는?
데티터 라벨링의 업무는 크게 두가지로 나뉩니다. 수집업무와 가공업무입니다.
수집업무는 이미지, 음성, 영상 등의 자료를 수집하는 것을 말합니다.
가공업무는 수집된 자료를 정교하게 다듬는 과정입니다. 이미지나 영상에서 특정 대상을 마우스로 드래그하여 박스를 그리거나 주어진 음성을 듣고 받아쓰는 작업입니다.
가공 업무의 대표적인 것은 다음과 같습니다.
바운딩
바운딩은 도로 위 자동차를 인식을 위한 데이터가 필요한 경우 이미지 속 자동차 크기에 맞게 마우스로 네모 박스를 만들어 주는 작업니다.
스켈레톤 추출
스켈레톤 추출의 대표적인 작업은 특정 부위에 점을 찍는 작업니다. 얼굴의 눈, 코, 입의 경계선에 점을 찍는 일입니다. 이 작업은 사람이 어떻게 생겼는지 학습하기 위한 작업입니다.
감정 태깅
감정 태깅은 얼굴의 표정이나 감정. 문장을 읽을 때 느껴지는 감정을 보기 위함입니다. 인공 지능의 인간 감정에 대한 인식을 고도화하기 위해 사용되는 일입니다.
문장 비교
주어진 복수의 문장이 같은 의미인지 아닌지 표시하는 작업입니다. 인공지능이 문장을 정확히 파악하게 도움을 주는 작업입니다.
키워드 찾기
이는 주어진 대화에서 핵심이 되는 키워드를 찾는 작업입니다. 이것은 챗봇의 고도화를 위해 사용됩니다.
화자 구분
이것은 음성을 듣고 같은 사람의 음성인지 다른 것인지 표시하는 작업입니다, 인공지능 스피커에 많이 활용됩니다.
데이터 라벨링 하기
크라우드웍스를 기준으로 말씀 드리겠습니다. 먼저 회원가입하시구요. 본인인증과 회원정보를 입력합니다. 로그인 하시면 워크페이스로 이동합니다. 리스트를 확인하시고 내가 할 수 있는 프로젝트를 클릭하시면됩니다. 프로젝트에 다라 개인정보 수집 및 이용에 대한 동의를 거치고 작업 페이지로 이동합니다. 이동한 후 작업진입 페이지에서 프로젝트와 관련된 주의 사항 및 가이드를 확인하고 본격적으로 작업을 진행하시면 됩니다.
작엄을 마치면 검수를 해야 합니다. 작업한 것이 가이드에 맞춰서 작업이 잘 되었으면 포인트가 지급됩니다, 그렇지않으면 반려가 됩니다. 반려된 작업은 정해진 시간 안에 재작업 후 다시 검수 과정을 거칩니다. 검수작업이 완료되면 포인트가 지급되구요. 이는포인트 이력에서 확인이 가능합니다. 이렇게 쌓인 포인트는 수익금 지금신청 페이지에서 원하는 만큼 지급을 받습니다.
데이터 검수자 되기
데이터 검수자는 데이터 라벨러가 작업한 프로젝트가 가이드에 맞게 작업이 되었는지 검수하는 사람입니다. 크라우드웍스에서는 ‘기본검수자격인증과정’을 수료해야 검수자가 될 수 있습니다. 교육과정은 작업의 난이도에 따라 입문, 중급, 전문가 과정으로 나뉩니다. 데이터 라벨러로 활동하더라도 도움이 되는 과정입니다. 이 과정도 들어볼 것을 추천합니다.
국민 내일 배움 카드 바로가기
데이터 라벨러는 얼마나 벌수 있나?
이 부분이 가장 궁금하실 것인데요. 프로젝트의 난이도에 따라 포인트의 차이가 있습니다. 또 작업자의 시간마다 달라집니다. 많이 버는 경우에는 2시간 마다 4만원을 버는 경우도 있습니다. 전업보다는 부업의 개념이 강하기 때문에 이점 참고하시기 바랍니다.