事例紹介

欠損データを補いながら評価資料を作りたい
[Excel作業代行事例]

業種
利用規模
解決した問題
背景 1回限りのデータ加工なので、システム化ではなく、作業としてのご依頼。
データが機械的に作業できるレベルになく、補正しながら使うことに。
方針 最初想定した手順通りでは矛盾するケースが続出。
作業を進めながら考えて、その場その場で新たな対応を迫られた。
効果 最終的には目視も含めて何度もチェックを行い、無作為抽出でエラー検出ができないレベルにまで精度を向上。

学歴と職歴を通算で評価したい

ご相談の経緯

従業員の評価を行うに当たり、学歴も含めた評価をしたいニーズがありましたが、年に何回も行うものではないことから、システム化ではなく、突発の作業としてのご相談です。

データ件数が数十万件もあったこと、そのまま機械処理しようにも、エラーが多すぎてどこから手を付けて良いか分からなかったのが、外部委託する理由でした。

 

対象データの特徴

元々昇進などを記録したデータがあり、いつどこにどの役職で担当したかが分かるようになっています。

更に、入社時に提出した履歴書情報から、前職がどこでどんな経歴かも、同様の形式でデータ化されています。

これをつなげれば、自社だけでなく他社での経験も同列に評価ができるようになります。

これに、入社時の資料を基にした学歴情報も加えたかったのですが、

  • 項目の並び順がそもそも異なる
  • 入学~卒業年月が正しく入っていないデータが多数ある
  • 就業後留学するケースなど、学歴→職歴とは限らない
  • 複数の職場を兼務するケースがあり、期間が重なる

という、かなり特殊な人たちを対象とした、特殊なデータを加工する必要がありました。

Excel作業代行事例

 

未入力 vs 誤入力

「入学~卒業年月」については、

  • 未入力(ブランク)
  • 明らかな誤入力(2999年3月など)
  • 入学>卒業のように、逆転している

のように、単に正しく入力されていないというレベルを超えて、登録時にまるでチェックがされていない状況でした。

本来であれば、こうした「正しくないデータ」は遺棄してしまうのですが、全体の3割以上がこうしたデータで、下手をすれば多くの社員が「学歴無し」やら「せっかく大学院まで行ったのに大卒扱い」のようになってしまいます。

 

いかに補正するか

そこで、修正できそうなデータは極力修正することにしました。

  • 入学~卒業が逆転しているものは、逆転して2 or 4年以上間隔が空いていれば正規とみなす
  • 入学のみで卒業がブランクの場合、2 or 4年後の数値を補填。逆も同様。
  • 海外留学のように入学~卒業が入れ子になっている場合、卒業が新しい方のみ採用

といった具合で、半分くらいの「正しくないデータ」の補正に成功しました。

他にも、就職後に留学したようなケースが以外と多く、例えば兼務中に留学した場合は表現できないので、期間がかぶった場合は終了日を基準に並べる、といった基準を、データ整備をしながら整える、というやり方となりました。

Excel作業代行事例

 

資料作成後、目視でチェック

データ整形ルールだけでも8パターンほどありましたが、これらの整形を追えた後、今度は時系列に並べて資料の体裁に落とし込みます。

データを見ているだけだと気づかなかったのに、データを並べて見ると異常値として浮かび上がるケースがあります。

たとえば、ある社員は10年ほど学歴も職歴も無かったので調べて見たところ、実際に「浪人」ということで活動記録がなかったり、元データを一部補正し直すことで正しくなったり・・・と、最終的に3万件近いデータに様々なフィルタを設定して、目視と合せて確認し、修正を加えることを繰り返した結果、無作為抽出で検査をしても異常値が見つからないレベルにまで精度を向上させることができました。