Category: Blog

annotation

データラベリングの品質を確保するための基本的なガイド

データのラベル付け品質の問題は、AI/MLコミュニティで大きな関心事となっています。このパズルを解くときに出くわす最も一般的な「原則」は、おそらく「Garbage in, garbage out」でしょう。

このように言うことで、私たちが強調したいのは、人工知能や機械学習の開発プロジェクトにおけるトレーニングデータとの基本的な法則です。AI/MLモデルに供給される質の悪い学習データセットは、操作に多くの誤りをもたらします。例えば、自律走行車のトレーニングデータは、その車が道路上で機能するかどうかの決め手になります。質の悪いトレーニングデータを使用すると、AIモデルが人間を物体と間違えたり、逆に物体を人間と間違えたりする可能性があります。いずれにしても、質の悪いトレーニングデータは事故のリスクを高めることになり、自律走行車メーカーにとっては最も避けたい事態となります。
高品質な学習データを得るためには、データ処理の過程でデータラベリングの品質保証を行う必要があります。

弊社は高品質なトレーニングデータセットを確保するために、以下の3つのアクションを行っています。AI/MLモデルに最適なトレーニングデータを提供するための基本的なガイドをご覧ください。

 

1. データラベリングの品質管理を強化するためのお客様の要求を明確化

品質の高いデータラベリングとは、単に最も丁寧にアノテーションされたデータや、最高品質のトレーニングデータを意味するものではありません。戦略的なデータアノテーションプロジェクトでは、トレーニングデータの要件を明確にする必要があります。アノテーションチームのリーダーが答えなければならないのは、どの程度の品質のデータが必要なのかということです。

データアノテーション品質を提供するベンダーとして、私たちが常にお客様にお聞きするのは、その要件です。「データセットを扱うのにどれだけ手間がかかるか」、「アノテーションの精度はどうしたいか」などです。これらの質問に答えることで、後々のプロジェクト全体のベンチマークとなるのです。

 

データラベリングの品質を確保する方法

データラベリングの品質を確保する方法

 

人工知能と機械学習の実装は非常に幅広いことを覚えておいてください。自律走行車や交通機関での一般的なアプリケーションのほか、AIやMLはヘルスケアや医療、農業、ファッションなどでもデビューしています。それぞれの業界には、何百もの異なるプロジェクトがあり、異なる種類の対象物を扱い、それゆえに異なる品質要件があります。

簡単な例として、道路のアノテーションと医療データのアノテーションを紹介します。道路のアノテーションの場合、作業は非常に簡単で、一般的な知識を持ったアノテーターがいれば大丈夫です。一方、このアノテーションプロジェクトでは、アノテーションが必要なデータセットの数が数百万の動画や写真にも及ぶため、アノテーターは許容範囲内の品質で高い生産性を維持する必要があります。

一方、医療データでは、特定の知識を持った医療分野で働くアノテーターが必要です。糖尿病性網膜症の場合、訓練を受けた医師が写真から糖尿病性網膜症の重症度を評価することで、この分野にディープラーニングを適用することができます。

 

データラベルの品質 - 医療用

データラベリングの品質:医療用

 

よく訓練された医師であっても、すべてのアノテーションがお互いに一致するとは限りません。一貫した結果を得るためには、1つのアノテーションチームが各ファイルに何度もアノテーションを行い、最終的に相関関係を得る必要があるかもしれません。それは、与えられたデータがどれだけ複雑か、またお客様がどれだけ詳細なデータ出力を望んでいるかという問題です。これらが明確になれば、チームリーダーは必要な成果を得るためのリソースの配分を考えることができます。指標と品質保証プロセスはこの後に定義されます。

また、クライアントは、アノテーションされるすべてのデータセットの「ベンチマーク」となるサンプルセットを提供する必要がある。これは、データアノテーションの品質を保証するための、最もわかりやすい手法です。完璧にアノテーションされたデータの例があれば、今度はアノテーターがトレーニングを受け、仕事のベースラインを提示することができます。

ベンチマークを理想的な結果とすることで、各アノテーターの精度やパフォーマンスを評価するための一致率の指標を算出することができます。アノテーションとレビューの両方のプロセスに不確実性がある場合、QAスタッフはこれらのサンプルデータセットを使って、どれが適格でどれがそうでないかを定義することができます。

 

2. 多層的なQAプロセス

データラベリングプロジェクトにおけるQAプロセスは、企業によって異なります。ロータスQAでは、国際的に標準化された品質保証プロセスを遵守しています。事前に設定された優先は、常にプロジェクトの開始時に明確にされます。これらの設定は1つの「ベンチマーク」にまとめられ、後にすべてのラベルとアノテーションの「ゴールデンスタンダード」として機能します。

2.1. 自己診断

このステップでは、アノテーターに自分の作業のレビューをしてもらいます。自己評価をすることで、アノテーターはプロジェクト開始時のデータアノテーションツール、アノテーション、ラベリングを振り返ることができるようになります。通常、アノテーターは、時間的にも仕事的にも大きなプレッシャーの中で仕事をしなければならず、そのために仕事に狂いが生じてしまう可能性があります。セルフチェックから始まる品質保証では、アノテーターがゆっくりと自分の仕事ぶりを見直すことができます。間違いや逸脱の可能性を認めることで、アノテーターは自分でそれを修正し、将来的にそれらを避けることができます。

2.2. クロスチェック

データサイエンス、特にデータアノテーションにおいて、「バイアス」という言葉を聞いたことがあるかもしれません。アノテーションの偏りとは、アノテーターがデータをラベル付けする際に独自の習慣を持っているため、提供されたデータに対して偏った意見を持ってしまうことを指します。場合によっては、アノテーターの偏りがモデルの性能に影響を与えることもあります。よりロバストなAIやMLモデルを構築するためには、偏ったアノテーションを排除するための有効な手段を講じる必要がありますが、そのためのシンプルな方法の一つがクロスチェックです。

 

データ・ラベリングの品質:クロスチェック

データラベリングの品質:クロスチェック

 

アノテーションの過程でクロスチェックを行うことで、作品全体の見方が変わり、アノテーターは同僚の作品の間違いやエラーを特定することができます。また、このような異なる視点を持つことで、レビュアーは偏った注釈を指摘することができ、チームリーダーはさらなる行動を起こすことができます。チームリーダーは、手直しをしたり、注釈が本当に偏っているかどうかを確認するために再度評価を行ったりすることができます。

2.3. マネージャーの評価

アノテーションプロジェクトマネージャーは、通常、アノテーションプロジェクトの日常的な監督を担当します。主な仕事は、作業員の選定と管理、データの品質と一貫性の確保などであります。マネージャーは、クライアントからデータのサンプリングを受けて、必要なメトリクスの作業を行い、アノテーターの教育訓練を実施する役割を果たします。クロスチェックが済んだら、マネージャーはアウトプットをランダムにチェックして、クライアントの要求を遵守しているかどうかを確認します。これらのチェックに先立ち、アノテーションのプロジェクトマネージャーは、品質保証のための「ベンチマークライン」を引かなければなりません。一貫性と正確性を確保するために、事前に設定した品質に満たない作業は、手直ししなければなりません。

 

3. 品質保証スタッフの関与

データラベリングの品質管理は、アノテーションチームだけに頼ることはできません。実際には、専門的で経験豊富な品質保証スタッフの関与が必須となる。アノテーション作業の最高の品質を確保するためには、品質保証スタッフのチームが必須である。品質保証スタッフは、アノテーションプロジェクトマネージャーの管理下ではなく、アノテーションチームの外にある独立した部門として働きます。
データアノテーションスタッフ全体に占める品質スタッフの理想的な割合は10%を超えません。QAスタッフは、プロジェクト内のすべてのアノテーションされたデータをレビューすることはできませんし、するつもりもありません。実際には、ランダムにデータセットを取り出して、もう一度、アノテーションをレビューします。

 

データラベリングの品質:品質保証

データラベリングの品質:品質保証

 

これらのQAスタッフは、データサンプルについて十分な訓練を受けており、アノテーションされたデータの品質を評価するための基準を持っています。これらの評価基準は、事前にQAチームのリーダーとアノテーションプロジェクトマネージャーの間で合意されなければなりません。セルフチェック、クロスチェック、マネージャーの評価の3段階のレビューに加えて、QAスタッフがアノテーションプロジェクトに参加することで、データ出力が事前に定義されたベンチマークに確実に適合し、最終的には最高レベルのトレーニングデータを確保することができます。

データラベリングの品質を向上するため、専門家の話をもっとお聞きしたいですか?ロータスQAにお気軽にお気軽にお問い合わせください

 

annotationannotationannotation

自動データラベリングが未来の技術になるのはなぜ?

自動データラベリングは、現在絶えず言及されている新機能であり、時間とリソースを要するカジュアルなマニュアルアノテーションの解決策とみなされています。データセットにアノテーションを施すのに何時間もかかるマニュアルデータラベリング(通称:マニュアルデータアノテーション)に対し、オートラベリング技術は、データを高度に処理するために、よりシンプルで速い方法のようです。

 

1. 通常のデータセットの扱い方

データラベリングの最も一般的でシンプルなアプローチは、もちろん完全な手動によるものです。人間のユーザーは、一連の生ラベル付けされていないデータ(画像やビデオなど)を提示され、一連のルールに基づいてラベル付けを行うことになります。例えば、画像データを処理する場合、分類タグ、バウンディングボックス、ポリゴン分割、キーポイントなどが代表的なアノテーションの種類です。

 

自動データラベリング ・セグメンテーションのデータラベリング

自動データラベリング ・セグメンテーションのデータラベリング

 

最も簡単で安価なアノテーションである分類タグは、わずか数秒で済むかもしれませんが、細かいポリゴンのセグメンテーションは、オブジェクトの各インスタンスごとに数分かかる可能性があります。
AIオートメーションがデータラベリング時間に与える影響を計算するため、ユーザーがオブジェクトの周囲にバウンディングボックスを描き、与えられたリストからオブジェクトクラスを選択するのに10秒かかると仮定してみましょう。これは私たちの経験的な証拠に裏付けられた観察可能な仮定です。

今回のケースでは、10万枚の画像と1枚あたり5個のオブジェクトからなる典型的なデータセットの場合、ラベリングには約1,500工数がかかり、これはデータラベリングだけで約1万ドルを費やすことに相当します。

また、ラベリングされたデータを手作業で確認するための品質管理のレイヤーを追加することが納品までの時間も長くなります。訓練されたユーザーでさえ、各バウンディングボックスの注釈をチェックするのに約1秒かかるため、ラベリングのコストが約10%増加します。

ワークフローの中には、コンセンサスベースの品質管理を採用する場合があります。これは、複数のユーザーが同じデータに注釈をつけ、その結果を統合/比較して品質管理を行うものです。コンセンサスベースのワークフローでは、コンセンサスを得るために重複した作業を行うユーザーの数に比例して、かかる時間と費用が大きくなります。簡単に言えば、3人のユーザーが同じ画像に3回ラベル付けをした場合、3回分のアノテーションの費用が必要になるということです。

ここで強調しておきたいのは、データラベリングにおいて最もコストのかかるのは下記の2つのステップです。

  • データラベリング自体
  • 品質管理のためのレビューと検証作業

したがって、オートラベル技術の最大の目的は、データラベリングと検証の両方にかかる時間を短縮することです。

ありがたいことに、AIと機械学習の進歩により、Auto-Label技術は大きく進歩しました。しかし、すべてのAuto-Labelテクノロジーが同じように作られているわけではなく、多くの場合、AIを使用する素朴な試みは、AIによって引き起こされたエラーを修正するために、より多くの人間の入力を必要とすることになります。そのため、選択したAIがデータのワークストリーム全体にどのような影響を与えるかを極めて慎重に判断しなければなりません。

ここでは、Superb AIのAuto-Labelとは一体何なのか、この技術の背景にある目的、そしてSuperb AIがこの分野でどのような進歩を遂げているのかをご紹介します。

 

2. オートラベリングのメリット

オートラベリングという言葉は、この分野では非常に新しい言葉ですが、それを実装し実現するための技術的進歩は高速で進んでおり、現在では多くのツールが市場に出回っています。では、データラベリングとはどのようなもので、どのようなメリットがあるのでしょうか。

2.1. オートラベリングとは?

 

オートラベリングとは?

オートラベリングとは?

 

オートラベリングとは、人工知能(AI)を応用してデータセットのエンリッチ、アノテーション、ラベリングを行うデータアノテーションツールに搭載されている機能です。この機能を備えたツールは、機械学習のためのデータラベリングにかかる時間とコストを削減するために、人間の作業を増強します。

ほとんどのツールでは、事前にアノテーションされたデータをツールに読み込むことができます。プラットフォームに進化しているより高度なツール(例えば、ツールとソフトウェア開発キット(SDK)を組み合わせたもの)では、AIを活用したり、独自のアルゴリズムをツールに持ち込んだりして、データをオートラベリングすることで、データエンリッチメントのプロセスを改善することができます。

また、作業者がアノテーションを検証できるように、アノテーションを提案する予測モデルを提供するツールもあります。また、内蔵されたニューラルネットワークを活用して、アノテーションを行うたびに学習する機能もあります。これらの機能はいずれも、機械学習チームの時間とリソースを節約し、データアノテーションのワークフローに大きな影響を与えるでしょう。

2.2. オートラベリングの優れたメリット

機械学習のために画像をアノテーションするツールを使用している組織との仕事の中で、オートラベリングがデータアノテーションのワークフローに適用された場合、2つの方法で役に立つことがわかりました。

データセットの一部または全部に事前にアノテーションを施します。自動化された後、作業者はアノテーションを確認、修正、完成させます。自動化ですべてのアノテーションを行うことはできず、例外やエッジケースが発生します。完璧とは言えませんので、必要に応じて人がレビューや修正を行うことを計画しなければなりません。

人に送る仕事の量を減らす。自動ラベリングモデルは、ユースケースやタスクの難易度などに基づいて信頼度を割り当てることができます。また、データセットにアノテーションを付与し、信頼度の低いアノテーションをレビューや修正のために担当者に送ります。

自動化機能を備えたツールを使用するチームと、同じデータに手動でアノテーションを行うチームに分かれて、時間をかけた実験を行いました。自動ラベリングが低品質な結果をもたらし、アノテーション作業に要する時間が長くなるケースもありました。一方で、自動ラベリングが有用な出発点となり、作業時間が短縮されたこともあります。

 

オートデータラベリング: メタデータ

オートデータラベリング: メタデータ

 

ある画像のアノテーション実験では、自動ラベリングに人力によるレビューと改善を組み合わせることで、100%手作業によるラベリングプロセスよりも10%速くなりました。この時間短縮は、自動化が時間をかけて学習されるにつれて、40%から50%の速度に増加しました。

また、車両については5ピクセル以上の誤差があり、カメラから最も離れた物体を見逃していました。この画像では、自動ラベリング機能により、ゴミ箱に人のタグが付けられているのがわかります。アノテーション前の予測は既存のモデルに基づいており、オートラベリングのミスはそれらのモデルの精度を反映していることを覚えておく必要があります。
データアノテーションツールには、人工知能を使ってデータにラベルを付けるオートラベリングとも呼ばれる自動化機能を搭載することができ、作業員はそのラベルを確認したり修正したりすることで、作業時間を短縮することができます。

道路標識のスクリーンショットでは、自動ラベル付けにより、ゴミ箱を囲むバウンディングボックスで画像を豊かにすることができました。これは間違いでした。その物体を人としてラベル付けしてしまったのです。オートラベリングは完璧ではありませんが、データラベラーのチームにとっては、出発点として役立ち、作業時間を短縮することができます。

 

オートデータラベリング:データが鍵となる

オートデータラベリング:データが鍵となる

 

プレアノテーションに適したタスクもあります。例えば、私たちの実験の例で言えば、プレアノテーションを使って画像にラベル付け、データラベラーのチームがラベルやバウンディングボックスのサイズを変更するか削除するかを判断することができます。このラベリング時間の短縮は、ピクセルレベルのセグメンテーションで画像にアノテーションを施す必要があるチームにとって有益です。

オートラベリングを適用するには、創造性が必要だということです。オートラベリングをうまく活用しているお客様は、必要に応じて試行錯誤を繰り返すことを厭わないことがわかりました。オートラベリングは、AI技術、特に機械学習をより良く理解するための一つの突破であり、この新しい用語にはまだ多くの発見があります。

 

Website: https://jp.lotus-qa.com/
Tel: (+84) 24-6660-7474
Fanpage: https://www.facebook.com/LotusQualityAssurance

BlogBlogBlogBlogBlogBlogBlogBlogBlogBlogOutsouring

オフショア開発を実施する際にどんな課題に直面しますか?

新型コロナウイルスのの世界的流行による経済活動の停止のため、多くの企業はDXの導入を検討し、実装しています。企業はDX推進のために実行可能での費用対効果ソリューションとしてオフショア開発サービスを選択しています。しかし、オフショア開発はあらゆるビジネスに適するソリューションではありません。このモデルはコスト削減に優れたメリットの一方で、取り組むべき多くの課題ももたらします。これらの慢性的な問題は、大規模なタレントプールと健全な財政を維持できる企業であっても、企業のDX導入に悪影響を与える可能性があります。これらの困難に収拾しように、下記の オフショア開発の課題 を一緒に深くを極めてしましょう!

 

1. エンジニアの質

オフショア開発を実施したい企業はより低コストで望みのような結果が得られることを非常に期待しています。 ただし、これは単に理想的な遠景です。実際に、多くのオフショア開発プロジェクトは求めるレベルを満たさないオフショアチームのエンジニアのため失敗してしまいました。

オフショア開発企業と協業する際に、技術的な面で双方間の非互換性はしばしば発生します。プロジェクトに適しないスキル・経験を有すエンジニアの参加は製品の品質に良くない影響を与えます。最悪の場合は納品されたものが正常に動かないことです。

 

オフショア開発プロジェクトの問題点:エンジニアの質

オフショア開発プロジェクトの問題点:エンジニアの質

 

問題解決:オフショア チームをうまく稼働させるように、企業はオフショアチームにコミュニケーションと技術面で要件について全体像を描くことが必要です。例えば、必要なプログラミング言語、フレームワーク、さらにはソフトスキルなどを明確にすべきです。要件が詳しければ、詳しいほどいいです。そして、面接を設定して、実績とエンジニアの質をしっかり見極める必要もあると思います。

 

2. 追加コスト

オフショア開発は大幅にコストを削減することに役立つが、追加コストがかかる場合もあります。これらの追加コストは、追加のインフラストラクチャコスト、管理コストや手戻りコストであることが可能です。

そして、いかなる変更は費用対効果の減少につながる可能性があります。最終的に、これは採用パーティーの提案と財務計画に消極的な影響を及ぼすかもしれません。

問題解決:発注前の準備を綿密に行うのは追加コストを抑えることに役だちます。具体的には発注の目標を明確にしたり、適当なオフショア開発プロバイダーを選択したり、必要な費用を精密を計算したりすること等をすべきです。これにより、作業プロセスがより円滑に行われ、仕事の品質が確保されるので、手戻り等のコスト・時間を下がることできます。企画設定と費用推定などに骨を折る場合はオフショア開発分野におけるスペシャリストを依頼すべきです。

その上、開発過程での変更に対応できるオフショア開発企業を選択することも追加コストのリスクを減少すことに役だちます。

 

3. オフショア開発プロジェクトにおける時差

オフショア開発を実施すると、時差は双方間のコミュニケーション効果を大きな影響を及ばすかもしれません。お客さまとベンダー間の時差が大きすぎると、メール、特に電話にてコミュニケーションは一段難しくになります。製品に何かトラブルまたはバッグ等が発生する場合、時差によるレポート・処理の遅れは双方に甚大な被害をもたらす可能性があります。

したがって、日本企業が発注したい時、オフショア開発先としてアジア圏内を選択すれば、時差によるリスク・問題を減少することができます。これはベトナムをはじめとしてアジア諸国でのオフショア開発を実施することは企業に注目されています。

オフショア開発プロジェクトの問題点:時差

オフショア開発プロジェクトの問題点:時差

 

問題解決:日本とベトナムの時差はわずか2時間だが、時差による問題がまだ起こすことが可能です。異なるタイムゾーンといった問題に対処するために、自社とベンダーは相談して、固定スケジュールを設定する必要があります。このスケジュールには、、何が達成されたか何が達成されるべきかについて定期的なチェックポイントと会議が含まれるべきだと思います。

 

4. コミュニケーション不足

コミュニケーション不足は、オフショア開発プロジェクトで最大の問題の1つです。この問題の原因として、次の要因が考えられます。

4.1. 言語の壁

多くの国際的なクライアントと取り組まなければならないため、言語の壁はどのODCにとって一般的な課題です。日本語がどれほど上手であっても、外国人である開発チームが日本語でプロジェクトの要件を理解するのは困難だと考えられています。その上、仕様書が日本人のスタッフであっても理解しずらい場合もあるから、それを他の言語に翻訳するのは誤解につながる可能性があります。双方間の誤解が誤解が生じると、確認・修正のために追加時間とコストがかかることになります。

問題解決:専門的な知識と高い日本語スキルを有すブリッジSEとコミュニケーターを採用することが言語の壁を乗り越えることに役立つ方法の一つです。オフショアチームの技術エンジニアも、日本語での基本的なIT用語を把握することが必要です。その上、双方の技術エンジニアは複雑な単語・用語を最小限に使用することが期待されています。これにより、誤解が発生するリスクが大幅に抑えられます。

 

オフショア開発プロジェクトの問題点:コミュニケーション不足

オフショア開発プロジェクトの問題点:コミュニケーション不足

 

そんな問題を解決するために、言語能力について要件を明確にすることもお勧めされています。オフショア開発を実装している多くの企業は、最初の要件としてオフショアチームの日本語能力証明書を要求しています。面接も望んでいる日本語能力を有すオフショアチームを確認するために、実施されるかもしれません。

言語の壁による誤解をなくすために「最後の手段」は、日常の情報を交換することです。例えば、写真や図は通常の会話よりも直接的に話し、詳細な説明の時間と労力を節約します。

4.2. 文化の違い

文化の違いは、オフショア開発における誤解を与える主な要因ではないが、双方間のコミュニケーションにも消極的な悪影響を及ぼしています。文化の違いはコミュニケーションにおける誤解をもたらし、仕事効果とチームの士気を悪い影響を与える可能性があります。

問題解決:文化の違いは地理、歴史、政治や宗教などの要素に関係しているので、目指しているオフショア開発委託国の習慣、特徴的なワークスタイル・性格や生活水準などをまじめに研究すべきです。これは「カルチャーショック」を和らげるだけでなくコミュニケーションにおける誤解を減少することに役だちます。その上、快適な作業環境を作成できるように、ミーティングにおいて相手国の言語で簡単な言葉を話すこともいいアイデアだと言われています。しかし、異文化の環境における仕事をすると、一番大切のは自分と相手の違いを理解し、尊重することだと思います。

 

5. 不明確な目的と期待

締め切りに間に合わなかったり、燃え尽き症候群有病率と離職率が高くなったりすることは期待を達成しなかった兆です。特に、ワ​​ークロードが指数関数的に増加しているIT業界では、残業や労働時間の頻度が高くなっています。これは従業員が強いストレスをかんじることにつながります。

リーダーシップとコミュニケーションの不足による不明確な目標は漠然とした戦略につながることが可能です。

 

オフショア開発プロジェクトの問題点:不明確な目的

オフショア開発プロジェクトの問題点:不明確な目的

 

問題解決:目標を明確にする:具体的で測定可能な目標を設定します。測定可能な目標を設定すると、達成度を数値で計算できるので、チームマネージャーが運用作業を追跡しやすくします。いずれかのタスクで問題が発生した場合、担当者を即座に特定して、タイムリーな解決策ができます。

目標を明確にした後、それらの目標を達成するための期限を設定することも必要があります。自社とプロバイダーの双方が一緒に各リリースに最適な時間枠とスケジュールを定義する必要があります。

6. セキュリティのリスク

オフショア開発を行う際、セほとんど企業は非常にキュリティの面で懸念を抱くようです。国内のサードパーティはおろか、外国の企業にITに関連する重要な作業を割り当てるのは深刻なリスクをもたらします。機密情報が流出するのは双方のイメージ・経済の面に対して深刻な損失をもたらす可能性があります。

しかし、オフショア開発サービスに対して大口顧客の認識とともに急速な発展につれて、セキュリティの安全性は速いペースで高められます。 オフショア開発企業は顧客に法的な機密性と厳格な物理的セキュリティレイヤーの提供を確約します。

 

オフショア開発プロジェクトの問題点:セキュリティのリスク

オフショア開発プロジェクトの問題点:セキュリティのリスク

 

問題解決:セキュリティーリスクを回避する最善の方法は、信頼できる経験豊富なオフショア開発企業と協業することです。これにより、自社のプロジェクトは故意的に情報持ち出しをする人だけでなく法的障壁からも保護されます。これを確実にするために、自社に採用された法律関係のコンサルタントが作業プロセスに参加することも必要です。

 

オフショア開発を行う際の問題直面している場合は、お気軽にご連絡ください

test

ソフトウェアテスターを評価するための 適切な面接質問

 

ソフトウェアテストは、製品の質を保証するためににソフトウェア開発ライフサイクルにおける必須の作業であるので、テクノロジー企業はテストチームを構築することが必要です。

市場でソフトウェア開発者の数が増えていることと反対し、ソフトウェアテスターは豊富ではありません。テスターの需要が高くなっているが、企業は新卒業生である候補者を拒否する傾向にあります。その理由で、テスターの不足という状況は驚くべき問題になっています。

 

Interview Software Tester - Essential checklist

適切なチェックリストの作成

 

テスターに高給を支払う企業も増えてきましたが、、経験豊富なソフトウェアテスターを採用できることは本当に困難です。したがって、ジュニアテスターのスキルと知識を高めようと努めている企業もあります。

ソフトウェアテスターの人材が豊富だが、経験の不足という状況に対応するように、企業は候補者向けて必要なスキル等につてい徹底的なチェックリストを準備することが必要です。下記はソフトウェアテスターを採用する際に、企業が考慮すべき技術的側面です。

  • テストの種類とテストへのアプローチ方法に関する基本的な知識
  • テスト環境
  • 異なる分野における候補者のテストに関する知識と経験
  • テストツール
  • テストプロセス

 

面接担当者が面接プロセスについて明確にすべきなこと

  • 探しているテストエンジニアの種類:テストに関して最も人気のある2つの仕事は、手動テストと自動化テストです。それぞれの仕事に対して、面接時に適当な基準を考慮すべきです。
  • ターゲット分野:あなたのビジネスが特定の業界・分野内でサービスまたは製品を提供している場合は、ターゲット分野を明確にするのは複雑ではないようです。しかし、人材を募集するITアウトソーシングベンダーに対して、次のプロジェクトの分野を定めることは、最適な候補者を見つけることに役だちます。
  • テスター向けて適切なキャリアパス:仕事を探す時に、テストエンジニアはその企業が自分のキャリアパスにどうように役立つかをすごく関心します。それで、将来の対立を避けるために、雇用者と候補者の両方は出されるキャリアパス制度の均一を確保してください。
  • 才能のギャップは一般的ですが、市場に出回っているテスターを雇わなければならないという意味ではありません。 テスターに何を求めているかを慎重に検討することで、適切な候補を見つけることは完全に難しい課題ではありません。

 

1. テストの種類とテストへのアプローチ方法に関する基本的な知識

テスター仕事に​応募したいすべての受験者は自分が取り組んでいきているテストタイプについて基本を把握することが必要です。例えば、GUIテストとAPIテストの違いが指摘できない場合、これは候補者にとって大きなデメリットになる可能性があります。基本的な知識が不足しているのはトレーニングに費やされる時間はさておき、作業中に多くの問題につながる可能性があります。

 

Interview Software Tester - Testing types

ソフトウェアテストの種類

 

しかし、面接官は、テスト種類の基本的な知識について質問への回答だけを踏まえて、面接結果を決定すべきではありません。これらの回答を通じて、候補者の理論的知識の把握がどのレベルかを評価することだけができます。

手動テストと自動化テストにつきまして、面接官はそれらの違いに関していくつかの質問をする必要があります。 これらの質問は、テストについて候補者全体的な知識を評価ことに役立ちます。

 

2. ソフトウェアテスト環境

簡単に言うと、テスト環境とはソフトウェアが正しく動作するか否かの検証作業を行う環境のことです。

 

interview-software-tester-test-environment

ソフトウェアテスト環境

 

テストプロジェックにおける候補者の能力を深く掘り下げたい場合は、下記にようなテスト環境について具体的な質問をする必要があります。

  • 受験者がテスト環境をセットアップするプロセスはなんでしょうか?このプロセスは十分に徹底しているか、システムのプロセスと類似していますか?
  • 候補者は複数のテスト環境をどのように設定しますか?
  • テスト環境に関する気をつけるべき要素はなんでしょうか?

 

3. 様々な分野における候補者のソフトウェアテストに関する知識と経験

デジタルトランスフォーメーション(DX)は現在生活のあらゆる側面に関係しているのは、ソフトウェアテストの需要が段々高くなることにつながります。ソフトウェアテスト作業は金融と銀行、ヘルスケア、農業、娯楽など分野における一般的になっていきます。

特定の分野によって、ソフトウェア構造が違うので、ソフトウェアテストプロセスも異なります。

 

Interview Software Tester - Test domains

様々な分野におけるソフトウェアテスト

 

例えば、金融および銀行システムでは、面接官はセキュリティテストプロセスについて候補者に尋ねる傾向にあります。

この理由は、金融機関や組織にとって、データセキュリティが最優先事項であるからです。個人情報と財政状態は、流出リスクが極めて高いと言われています。この分野でテスターとして働きたい候補者は、各トランザクションの安全性と正確性を確認する必要があります。金融や銀行で働く企業にとって、候補者がセキュリティテストをどのように実施するかについて質問を出たしたほうがいいと思います。

 

4. ソフトウェアテストツール

テストツールの種類がたくさんあるが、この記事ではプロジェックマネジメント支援ツールと技術に関連するツールを強調したいと思います。

まず、プロジェックマネジメント支援ツールは不具合修正と再テストの実施状況の管理、インシデントの管理や不具合の追跡などテストに関する様々なことができます。それで、面接の時、そのツールの使用に対して候補者の経験に関する質問を出ることをお勧めします。

次、技術に関連するテストツールについて、下記のような7つの主要な種類にテストツールを分ける必要があります。

  • 検出テストツール
  • モバイルアプリテストのツール
  • クロスブラウザテストのツール
  • テスト自動化ツール
  • 負荷テストのツール
  • APIテストツール
  • 脆弱性テストツール

上記のすべてのテストツールを使える人はけっしていないと思います。したがって、候補者が自社のテストチームに適しているかどうかを知るために、面接官はチームが使用する予定のテストツールについて具体的に質問する必要があります。

 

5. テストプロセス

テストプロセスは、テストチームが1つのプロジェクトをどのように処理するかを示します。通常、ソフトウェアテストは次のようにステージが含まれます。

  • 計画と管理
  • 分析と設計
  • 実装と実行
  • 終了基準の評価とレポート
  • テスト終了作業

 

Interview Software Tester - Testing process

ソフトウェアテストプロセス

これらのステージは、顧客の要求に応じて変更していきます。テストと品質保証の権威ある機関であるISTQBは、IT企業向けて国際標準化されたプロセスを推進しています。ただし、テストプロセスをカスタマイズするのは非常に一般的です。

プロセスの各ステージにおいて、テストが徹底的な分析と綿密な監督のもとで行われます。これらのステージには、厳格で高品質のプロセスを確保するために、ビジネス分析、テスター、開発者、およびQAスタッフが参加することが必要です。

上記のような紹介されれた技術的側面の5つを通じて、あなたが優秀で適切なソフトウェアテストエンジニアを見つけることを期待しております。

 

ソフトウェアテスターの採用の困難に直面している場合は、お気軽にご連絡ください

機械学習向け データアノテーション のガイド

データアノテーション の目的

機械学習

機械学習はというと、AIに内包されるもので、特定のタスクをトレーニングにより機械に実行させるものである。機械学習の手法は、教師あり学習、教師なし学習、半教師あり学習と強化学習の4選がある。

▸教師あり学習:教師あり学習とは、学習データに正解ラベルを付けて学習する手法である。これは、事前に与えられたデータをいわば例題とみなして、それをガイドに学習を行うというのアルゴリズムである。

▸教師なし学習:教師なし学習は、学習データに正解のラベルを付けないで学習させる手法である。つまり、機械学習モデルが自力でデータの法則性、特徴を見つけていく。

▸半教師あり学習:半教師あり学習は、文字通りに教師あり学習と教師なし学習と共通点がある手法となっている。

▸強化学習:強化学習とは、ある環境内におけるエージェントが、現在の状態を観測し、取るべき行動を決定する機械学習の一種。例えばゲーム業界に、この学習手法により、エージェントは、タスクの報酬を最大化する一連の意思決定を行うことができる。

手法には何選がありますが、最もよく使用されるのは教師なし学習と教師あり学習である。

 

教師データとは?

教師データとは、一つ一つのデータに対して付与される正解を示す情報のことである。基本的に割り当てられたタスクの実行をAIに教えるテキストで、何度も使用を繰り返して予測を微調整し、正解率を高めていく。

 

 

AI向け教師データの作成し方 (データアノテーション)

ステップ1:データ収集

正しいな教師データを収集するには、まず課題の内容 とそのビジネス上の価値を理解する必要がある。 アノテーションのデータ分類については、名前から 類推して キーワードを作成し、インターネットからのデータ検索ツールを使用して、画像を検索することが できる。 または、写真、SNSの動画、Googleの衛星画像、公共のカメラ や車(Waymo、Tesla)から 無料で 収集されたデータ、または 第三者からデータを購入することも できる(データの正確性については自己責任)。

一般的なデータタイプには、画像、動画、テキスト、音声、および3Dセンサーデータがある。

画像:人、物、動物の写真。

動画:CCTVまたはカメラから記録されたテープ。

テキスト:さまざまなドキュメントの種類で数字や単語が含まれ、複数の言語で書いても使用できる。

音声:人口統計が異なる人々からの音声レコード。

3Dセンサーデータ:センサーデバイスによって生成された3Dモデル。

 

ステップ2:課題を把握する

課題を把握すると入力データにどんな手法を選ぶのかわかっていく。 コンピュータビジョンには、以下のようにタスクがある:

▸画像分類:入力データを分類し、画像にクラスラベルを割り当てること。

▸物体認識(オブジェクト ディテクション):画像から検出する物体に点や線を設置、あるいは矩形(バウンディングボックス)で囲みます。そのオブジェクトが何であるかを示すタグ(クラス)と座標情報のラベル(ローカライゼーション)も付ける。

▸領域抽出(セグメンテーション):画像をセグメンテーションした(輪郭線情報をポリゴンにより付与)後、クラスラベルを付ける。

 

ステップ3:データアノテーション

要件を満たすデータセットを準備したら、次は どのような方法で アノテーションをするのか を決める必要がある。データは 決まった手法に応じて 処理されていく。例えば、分類の場合、「ラベル」はクロールするプロセスでインターネットからデータを見つける時に使用されるキーワードである。 その後、ツールを使用して 画像注釈(画像のラベルとメタデータを設定)を実行する必要がある。 一般的なツールには Comma Coloring, Annotorious, LabelMe などが ある。これらのツールは、画像の各セグメントに ラベルを付けるためのGUIを サポートする。

 

データアノテーションプロジェクトを担当するのは?

社内

データが自社で ラベル付けす

・長所:データの精度管理が容易、低コスト。

・短所:データの収集とラベル付けに 時間がかかる。

アウトソース(外注)

データアノテーションサービスを提供しているBPO・ITアウトソーシング企業に 依頼する。

・長所:データを すぐ集められる。

・短所:データの透明性、正確性がわからない。費用が かかる。

オンライン労働力

Amazon MechanicalTurkやCrowdflowerといったプラットフォームでアノテーションの業務を委託することができる。

・長所:労働力が多い

・短所:正確性がわからない。

 

機械学習を構築するには、データサイエンティストに複雑な機械学習タスクのインフラを構築させるだけでなく、入力データにラベルを付けるためのデータアノテーターも必要もあります。

 

Lotus Quality Assuranceは、さまざまなドメインで専門的なデータxアノテーションサービスを提供します。 品質レビュープロセスにより、高品質で安全なサービスを提供することをお約束します。 さらにサポートが必要な場合は、お問い合わせください。

OutsouringtestTesting

テスト自動化アウトソーシング :投資対効果 (ROI) を最大化するの5つのステップ

 

最近、アウトソーシングは企業のコストを削減するのに役立つだけでなく、戦略的管理のための効果的な選択にもなりました。典型的な例は、テスト自動化アウトソーシングです 。企業の製品やアプリの品質を向上させ、ビジネスリスクを軽減するのに役立ちます。テスト自動化と品質保証で10年以上の経験を持つLQAのテストチームは、ROIを最大化するためのテスト自動化アウトソーシングに関する5つのヒントを提供します。

 

1. エンゲージメントモデルを調べ

  • テスト自動化アウトソーシングモデルのタイプを決定するべき。 アウトソーシングプロジェクトをどの程度管理したいのかを考えましょう。より細かく制御し、リスクを軽減するために作業をより小さなプロジェクトに分割できるようにしたい場合は、インクリメンタルアウトソーシングが最適です。ただし、コアビジネスに集中し、テストアクティビティを第三者に任せたい場合は、トータルアウトソーシングが最良の選択だと思います。
  • ベンダーのパフォーマンスを管理するプロジェクトマネージャー(PM)を任命すること。 オンサイトモデルとオフショアモデルのどちらを採用する場合でも、プロジェクトマネージャーをクライアント側に派遣することで、ベンダーの能力を評価し、ベンダーのパフォーマンス管理プロセスを設定し、SLA義務の履行と適時性を追跡できます。

テスト自動化アウトソーシング:ROIを最大化するの5つのステップ

 

2.独立で高能力のベンダーを選択

同じ初期投資で、ROIの数値はベンダーによって異なります。独立品質保証会社は、客観性と徹底性を提供できるため、お気に入りのベンダーになりつつあります。さらに、テストに重点を置いているため、独立したQAベンダーは、適正価格で最高品質の結果を引き出すことができます。独立ベンダーは専門知識を提供できることが:

  • 全体のテスト自動化戦略を作成すること。
  • 柔軟なテスト自動化アーキテクチャを設計、開発、維持すること。
  • 最良のテスト自動化フレームワークを選択するのアドバイス。
  • UIとAPIレベルの両方で自動化をサポートすること。

 

 

3.水平方向のコラボレーションを設定

双方にとってより有益で便利なものにするために、ベンダーとのコラボレーションは水平レベルで実行する必要があります。 詳しくは以下のように:

当社側 コラボレーションの側面 ベンダー側
CTOあるいはCEO 戦略的整合、長期的な優先順位付け CTOあるいはCEO
ソフトウェア開発/ QAチームリーダー サービスレベルアグリーメント(SLA)の調整、KPIレビュー、契約の修正 アカウントマネージャー
プロジェクトマネージャ QA活動の優先順位付けとスケジューリング、リスク管理、プロセス調整 テスト自動化マネージャー
ビジネス分析、ソフトウェア開発、品質保証エンジニア 毎日のコラボレーション テスト自動化エンジニア

 

 

4. Establish performance measurement metrics

テスト自動化のメリットの1つは、簡単な測定と測定基準であいまいさを減らすことです。 作業単位は小さな成果物(1つのテストケース)であるため、1人あたり、1日に自動化されたテストの数を簡単に測定し、メンテナンスにどのくらいの労力が費やされているかを把握し、最終的にROIの決定に到達できます。 メトリックの確立には、次のアクティビティを含める必要があります:

  • ベンダーとのSLAおよびパフォーマンスメトリックを設定すること:パートナーシップを開始する前に、両当事者が協力して包括的なSLAを把握する必要があります。 さらに、契約には、ベンダーの責任と、サービスを測定するKPIも明確に記載するべきだと思います。
  • テスト自動化のアウトソーシングで発生する可能性のあるリスクを軽減すること:作業プロセスでは、技術的およびリソース関連のリスクにより、追加のコストとサービス提供の遅延が発生する可能性があります。特定されたリスクについて、管理者は軽減および緊急時対応戦略を策定するべきです。具体的な例の1つは、プロジェクトの負荷が変動する場合、マネージャーは、プロジェクトの負荷の事前定義された制限内での柔軟なリソース割り当ての可能性についてベンダーと交渉する必要があります。
  • SLA条件が遵守され、満たされていることを確認:プロジェクトマネージャーは、テスト結果レポートを定期的に確認する必要があります。 テストカバレッジや自動テストあたりのコストなどの指標の組み合わせに注意を払うことが大事です。

 

5. Moving forward to long-term collaboration

テスト自動化のアウトソーシングは、最初は手間がかかる作業かもしれませんが、長期的にはメリットがあります。長期実行プロジェクトの自動化は、プロジェクトが実行する限り、通常は何人年もかかります。したがって、自動化による節約と価値はこの期間にわたって維持され、その結果、ROIが向上します。さらに、自動化されたテストスクリプトは最小限の介入で済み、テストケースの実行とスクリプトエラーのトラブルシューティングの頻度が少なくて済みます。 反復的なタスクから離れて、より重要なビジネスプロセスに展開することにより、人的資源の使用率を向上させます。

 

品質保証とテスト自動化をアウトソーシングすることを決定する場合、最高のROIを達成するために考慮すべきいくつかの要素があります。 上記の5つのステップで、LQAは皆さまのアウトソーシングプロジェクトが望むように順調に進むことを望んでいます。 弊社とのコラボレーションでご要望がございましたら、こちらからお問い合わせください。

Testing

東南アジアの ソフトウェアテスターの給与 ガイド2021

[vc_row][vc_column][vc_empty_space height=”15px”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]シンガポール、ベトナム、マレーシア、インドネシアは、東南アジアの技術とソフトウェア開発の中心地です。 したがって、ソフトウェアテストエンジニアは最も需要の高いポジションの1つです。本レポートは、この4か国におけるテスターの給与の違いを把握できるよう、マネージャーの方々に役立っているのではないかと考えられています。[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]

1. 東南アジアソフトウェアテスターの給与範囲

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_single_image image=”17520″ img_size=”full” alignment=”center”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]4か国の中で、シンガポールはソフトウェアテスターの給与範囲が最も高い国と分かります。平均的にはテスターが毎月$5100の給料を受け取ります。最高月給は$7980で、最低月給は$2660です。 マレーシアは支払いの面で2番目の位置です。 ただし、その最大支払額はシンガポールのほぼ4分の1です。マレーシアのテスターの最低、平均、最高の給与は$690、$1270、$2030です。4つの代表的な国の中で、ベトナムの給与範囲はもっとも低いです。 ここでソフトウェアテスターを雇うのにかかる費用は、マネージャーに月額330ドルから2000ドルだけです。ベトナム人の平均月給は$650で、シンガポール人の3分の1です。 それにもかかわらず、最大支払い額はマレーシアとほぼ同じで、インドネシアよりも高くなっています。ーか月で、インドネシアのテスターは最低で360ドル、中程度で720ドル、最高で1120ドルを受け取ることができます。[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_empty_space height=”30px”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]

2. 年功序列により

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]

ジュニアソフトウェアテスター

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/2″][vc_single_image image=”17521″ img_size=”full”][/vc_column][vc_column width=”1/2″][vc_column_text]

ジュニアソフトウェアテスターは、ほとんど2年未満の経験があります。同じレベルで、シンガポーのテスターの月給は$3200で支払われます。これは、$780が支払われるマレーシアのテスターの給与の4倍になります。 3位のベトナムの月給は$690で、2位より$88少なくなっています。最も少ない月給の国はインドネシアで、月額$570、シンガポールの5分の1です。[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_empty_space height=”15px”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]

シニアソフトウェアテスター

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/2″][vc_single_image image=”17522″ img_size=”full”][/vc_column][vc_column width=”1/2″][vc_column_text]

より高いレベルに昇格すると、給料はかならず増加します。シンガポールのQAエンジニアの月給は$1700上昇し、$4900に達します。一歩、マレーシアの上級テスターの給与は月額$1050で2位にされています。より$180少ないのは、ベトナムの月給$870。最低のはインドネシアの給与で、月当たり$770かかります。[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_empty_space height=”15px”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]

ソフトウェアテストリードの給与

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/2″][vc_single_image image=”17523″ img_size=”full”][/vc_column][vc_column width=”1/2″][vc_column_text]

ソフトウェアテストリードを雇うには、シンガポールで月額$6400を支払う必要があります。 ベトナム、マレーシア、インドネシアの数字は、代表的に990ドル、1460ドル、1060ドルです。 最低の平均月給はベトナム、最高の月給の6分の1です。[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_empty_space height=”15px”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]

ソフトウェアテスト給与の責任者

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column width=”1/2″][vc_single_image image=”17524″ img_size=”full”][/vc_column][vc_column width=”1/2″][vc_column_text]

シンガポールのソフトウェアテストマネージャーの給与は、他の3か国に比べてかなり高いと分かります。 このレベルは$7900の月給を払われ、マレーシアの同じレベルのテスターの4倍となります。 ベトナムとインドネシアのテスターの月収はどちらも$1300の範囲ですが、インドネシアはより$60支払われます。従って、ベトナムは東南アジア地域で月給の最低の国になっています。[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_empty_space height=”30px”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]

3. 教育により

[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_single_image image=”17525″ img_size=”full” alignment=”center”][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]4か国すべてがグラフで同様のパターンを示しています。つまり、高等教育レベルのテスターに対してより高い給与を支払うということです。 その上、同じ程度で、シンガポールのテスターは他の地域より大幅に高い月給を受け取ります。証明書または卒業証書を持っているテスターは、シンガポールで月に$2660を獲得します。これは、ベトナムやインドネシアの8倍、マレーシアの4倍です。テスターが学士号を取得した場合、シンガポールで$5100が支払われます。マレーシアでは5分の1($1270)、インドネシアでは$720、ベトナムでは$650です。[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]上記の4カ国は東南アジアのITセンターの代表です。 本記事では、シンガポール、ベトナム、マレーシア、インドネシアでのソフトウェアテスターの給与の一般的な情報を示しました。すべての数字は、Persol KellyMichael PageFirstAlliancesなどの信頼できる情報源から収集されています。 本記事は、マネージャーがソフトウェアテスターを雇うことを決定する際の参考になれば幸いです。 それでも、マネージャーが採用に苦労している場合は、ソフトウェアテストのアウトソーシングサービスを使用するなど、他の選択肢もあります。

 

Lotus Quality Assuranceは、ベトナムで最初の独立したソフトウェアテスト会社です。 ISTQBのシルバーパートナーとして、国際的な経験を持つ有能なテストチームを提供します。 詳しくは、こちらでお問い合わせください。[/vc_column_text][/vc_column][/vc_row]

最良の データラベリングアウトソーシング ベンダーの選び方

 

ベトナム、中国、インドなどの新興BPOの目的地へのデータラベリングサービスのアウトソーシングは、最近の傾向になっています。 ただし、多くの企業の中から最適な データラベリングアウトソーシング ベンダーを選択することは容易ではありません。 この記事では、LQAが最適なベンダーを見つけるためのアドバイスを紹介します。

 

1.明確なプロジェクト要件を準備します

 

まず第一に、最終結果に対する自分の期待のすべてを示す明確で詳細な要件を準備することが重要です。 リクエストにプロジェクトの概要、タイムライン、予算を含める必要があります。 適切な要件は下記のようになります:

    • アノテーターはどのようなデータ型を処理するか?
    • どのようなアノテーションタイプをするか?
    • データにラベルを付けるには、専門知識が必要か?
    • データセットに高精度の注釈を付ける必要があるか?
    • 注釈を付けるファイルはいくつか?
    • プロジェクトの締め切りはいつか?
    • このプロジェクトの費用はいくらか?
    • 要件に一致するアノテーションタイプを提供していますか?

 

2.ベンダーを評価するための必須基準

 

要件を確定したら、どのベンダーと契約したいかベンダーリストから評価する必要があります。 多額の費用をかけ、品質低いデータセットを貰わないよう、この段階は非常に重要です。 経験、品質、効率、セキュリティ、チームメイトに基づいて評価することをお勧めします。

 

経験

 

データのラベル付けは簡単な作業のように見えますが、大規模のデータを効率的かつ正確に実行するには、細部に細心の注意を払い、特別なスキルが必要です。各ベンダーが具体的にあるデータアノテーション量でどのくらいの期間作業してきたか、及びアノテーターがどの程度の経験を持っているかをしっかりと理解する必要があります。評価するために、長年の経験、ドメインに関する知識、およびアノテーションタイプについてベンダーに問い合わせる必要があります。 例えば:

    • データアノテーションに何年の経験がありますか?
    • 以前に特別なドメインに関する知識を要求するプロジェクトでやったことがありますか?
    • 要件に一致するアノテーションタイプを提供していますか?

 

品質

 

データサイエンティストは、多くの場合、ラベルがどの程度正確に配置されているかによって、モデルトレーニングのデータセットの品質を定義します。ただし、1〜2回正しくラベル付けすることではなく、一貫して正確なラベル付けが必要です。下記のようにベンダーの高品質のラベル付きデータを提供する能力があるかどうか確認できます:

    • 以前のアノテーションプロジェクトのエラー率
    • ラベル配置の正確度
    • アノテーターは各ラベルに適切タグを付けたの頻度

 

次の動画でデータ品質の詳細をご覧ください :

 

効率

 

アノテーションは想像以上に時間がかかります。例えば、5分間のビデオでは、1文に平均24フレームがあり、ラベル付け画像が最大7200枚になります。アノテーターが1枚の画像のラベル付けに使う時間が長いほど、タスクを完了するために必要な時間が長くなります。プロジェクトを完了するための必要な工数を正しく見積もるには、ベンダーに下記のように確認する必要があります:

    • 各ラベルを配置するの平均時間
    • 各ファイルでラベルを付けるの平均時間
    • 各ファイルの品質チェックの時間

 

ベンダーのアノテーションチームがプロジェクトを直接実行するため、アノテーションチームの能力を理解することは重要です。ベンダーは、十分に訓練されたチームを提供すること。 さらに、テキストにラベルを付ける場合、ラベル付けチームがその言語を話せるかどうかを確認する必要もあります。また、ベンダーに、アノテーションチームを短期間でスケールアップまたはスケールダウンする準備ができているかどうかを確認することが重要です。プロジェクトのサイズは時間の経過とともに変化する可能性があります。

 

参考 :

 

3.パイロットプロジェクトを要求する

 

パイロットプロジェクトは、プロジェクトの実行可能を検証するために使用される最初の小規模なプロジェクトです。パイロットプロジェクトでは、新しいプロジェクトのリスクを管理し、本格的なリソースが投入する前に欠陥を分析できます。

ベンダーにパイロットプロジェクトを依頼する場合は、データセットからいくつかのサンプルデータを選択する必要があります。 様々なデータタイプ(データセットの複雑度に応じる。10〜15ファイル)を含む少量データから始めることができます。

ベンダーを正しく評価できるように、デモの詳細なガイドラインを提供することは重要です。最後に、デモテストの進行状況を確認する方法を聞くことが必要です。 その結果、品質とパフォーマンスの追跡ツールまたはプロセスが要件を満たしているかどうかを評価できます。

データラベリングのアウトソーシングベンダーと契約を結ぶ前に、注意すべきポイントを全て述べました。 この記事は、あなたが最良なパートナーを見つけるのに役立つなら何よりです。

 

データラベリングベンダーリストが立っているなら、LQAも含めてみませんか?ヘルスケア、自動車、eコマースなどのさまざまな分野でデータにラベルを付ける経験が豊富です。LQAの経験と以前のプロジェクトについて詳しい知りたい場合、お問い合わせください。

LQA News

新型コロナウイルス 感染症へ、企業はどのような対応をしていくべきなのでしょうか。

WHO は1月30日に、各国の専門家 や 保健当局担当者による緊急委員会を開催し、新型コロナウイルス に関連した感染拡大について、「国際的に懸念される公衆衛生上 の 緊急事態(PHEIC: Public Health Emergency of International Concern)」に該当すると宣言した。

新型コロナウイルス 「SARS-CoV2」による 感染症「COVID-19」は、パンデミック(感染爆発、世界的流行)となり世界各地の医療は もとより 経済にも 深刻な影響を及ぼしている。

新型コロナウイルス感染症へ、企業はどのような対応をしていくべきなのでしょうか。以下の記事で調べてみましょう!

 

世界的な状況の更新31/3

新型コロナウイルス-世界

新型コロナウイルス-世界

出典:ウィキペディア

 

 

新型コロナウイルス-状況

新型コロナウイルス

出典: Johns Hopkins University

更新31/3

 

2020年4月1日の時点で、200以上の国と地域で859,000件を超えるCOVID-19の症例が報告されており、約42,000人 が死亡している。 178,000人以上が 回復した。

飛沫感染は、感染者の. 咳やくしゃみから放出された飛沫粒子が空気を介して短距離範囲(一般的には 90cm 以内)に拡散し、近くにいる者の口、鼻、目の粘膜に付着することによって起こる。

 

症状と予防

WHOによると、発症早期は発熱・鼻汁・咽頭痛・咳嗽といった非特異的な上気道炎の症状のため診断に難渋することがある。最も一般的な2つの症状は、発熱(88%)と乾咳(68%)である。

コロナウイルスの感染を防ぐための戦略には、咳やくしゃみをする際に押さえた手や腕は、その後直ちに洗うべきであるが、接触感染の原因にならないよう、手を洗う前に不必要に周囲に触れないよう注意する。手を洗う場所がない
ことに備えて、携行できる速乾性擦式消毒用アルコール製剤を用意しておくことが 推奨される。咳をしている人に マ スクの着用を積極的に促す。マスクを適切に着用することによって、飛沫の拡散を防ぐことができる。

Coronavirus-prevention

 

新型コロナウイルス による企業活動へ影響

新型コロナウイルス-影響

出典: statista

 

企業が直面しないといけないビジネスへの影響には 次のものがあります。

  • 新型コロナウイルスの世界的流行に起因する労働力および部品の不足に直面しており、一部生産を停止する。 生産状況やジャストインタイムのサプライチェーンを混乱させてる。自動車、消費財、製薬などその他の業界にわたって 販売警告を発し、販売中止となった。
  • 原材料消費の減少に伴い商品価格が 下落しており、生産者は 減産を検討している。
  • モビリティと業務の混乱で中国国内の消費量が 大きく減少したため、航空、留学、インフラ、観光、エンターテイメント、ホスピタリティ、エレクトロニクス、消費財、高級品など、複数の部門で 多国籍企業が苦境に立たされている。

Coronavirus-impact

出典: TrendForce

 

企業はどのような対応をしていくべきなのでしょうか。

1. 感染防止対策を優先する

・内部事項に従い、マスクを使う。ワイヤー型のマスクで鼻と頬の隙間をなくし、 顔とマスクの間に隙間があるとウイルスを遮断できず、病原菌が侵入してしまいう。普段は1.2メートルの距離を保ちながら、状況に応じて使い分けていくとよいでしょう、…
・スタッフ全員がマスクを着用する必要がある。
・マスク、手洗い、手ぬぐいなどの衛生設備を配布
・オンライン会議を適用。
・スタッフに集会に出席しないように勧める。

 

Coronavirus-LQA

 

2. 従業員が会社で病気になったときにタイムリーな解決策がある

感染拡大を防ぐために、発熱、痛み、鼻汁、咳などの症状が見られる人は 自宅で医師による健康診断を行わなければならない。

会社で病気の従業員が いる場合、ビジネス代表者は タイムリーな解決策のアドバイスの為に ホットラインか政府機関に報告する必要がある。

 

3. 重要な仕事を維持する

事業活動に重要な仕事を維持するために、企業は 以下のように遵守する必要がある。

・交換容量を確保し、移転する事を検討する
・柔軟な作業場所を確保し、従業員が自宅で作業できるようにする。
・生産の維持と事業活動に関する情報を関係者に発表する。

信頼できるプロセスを持つパートナーを選択。

 

4. 組織能力と執行能力の転換

企業は、オペレーティングシステム と ビジネスモデルを確認、再分析し、技術を大幅に 改善して組織に適用する必要がある。さらに、生産と事業活動の運用に 焦点を当てて、雇用される人員の数、納期、およびビジネスのパフォーマンスへの依存を最小限に抑える。

 

現在、多くのアウトソーシング企業が、いつでも どこでも ビジネスを運営し、品質保証、データの準備、システムのトレーニングデータなど、企業の運用管理を支援している。これらの中で、LQAは 多くの大手パートナーから 選ばれている信頼できる企業の1つである。 LQAのサービスの詳細 については、こちらを参照してください。

 


Lotus Quality Assurance (LQA)

電話番号: (+84) 24-6660-7474
メール: [email protected]
ウェブサイト: https://www.lotus-qa.com/

LQA News

LQA社長のインタビュー2:社長の私生活の驚くべき事実

これまでのインタビューに引き続き、シュアンさんのような多忙を極めるような人はきっとよい仕事と生活のバランスを保っていると思い、彼女に個人に関する質問をしてみました。

 

これまでやってきた仕事についてお話してくださりありがとうございました。それではシュワンさんに関する質問をしていきたいと思います。子供のころの夢は何でしたか。

私は小さいころ画家になりたいと思っていました。なぜかというと私の父親が画家をしていたからです。そして彼は素晴らしい絵をたくさん描いていました。大学進学を決める際、父親は私に画家になりたいのかそれともエンジニアになりたいのか尋ねました。そして私はエンジニアになる道を選びました。そしてその選んだ道を後悔はしていません。私はテクノロジーを生み出すのが大好きで、そのために仕事のために目いっぱい働くのは全く苦ではありません。一方で絵を描くことは私の趣味であるといえるでしょう。私は時間があるときに絵をかきます。

 

自分の性格はどのようなものであると思いますか。

わあ。難しい質問ですね。私は決して諦めず、そして、強い野望を持った人物であると思います。私の周りの人もそう言います。

 

一番尊敬している人とその理由を教えてください。

これもまた難しい質問ですね。私はすべての人を尊敬しています。それはなぜかというと彼らは十人十色で私にたくさんの学びを与えてくれるからです。ですが一番私が尊敬してる人物を挙げるなら母親です。母親はまさに”never give up ”のお手本のような存在です。母親は大変な状況の中私を育ててくれましたが彼女は家族を偉大なものへと導いてくれました。

 

週末は何をして過ごしていますか。

私は2種類のことをしています。1つはリラックスでそれをするためにコーヒーを飲みに行くために友達と出かけたり、子供と遊んだり、読書や買い物に行ったりします。自分を幸せにし、次の週に備えるためエネルギーをチャージするために私はたくさんのことをします。娯楽とは離れて、新たな週の計画を作ったり検討するといった仕事に関することもします。

 

 

日本で好きなものを教えてください。

私は日本のすべてが好きです。人々、食べ物、環境が好きです。日本に初めて行ったとき、道に迷ったのですが老人が私のことを空港から寄宿舎まで連れて行ってくれました。そこまでの道のりは長かったのですが、彼はそれでも私を助けようとしてくれました。その時の私はとても幸運でした。日本の食べ物はとてもおいしく、環境はとてもきれいでクリアです。

 

考えを共有してくださりありがとうございます。最後になりますがいつもどのように過ごされているのか伺いたいと思います。LQAのCEOとしてシュアンさんは多忙な日々を過ごしているかと思いますが、どのようにうまく過ごしているのか興味があります。

 

とても退屈ですよ(笑)。

-4:30:起床、メールチェック、一日のスケジュール確認

5:30 – 6:30: ジムでエクササイズまたは日本語の勉強

6:30 – 7:30: 家族と朝食

7:30 – 8:00:娘を学校に送迎後、出勤、

8:00 – 18:30: 仕事

18:30 – 21:30:夕食づくり、顧客との会食がなければ子供たちと遊ぶ

21:30 – 23:00:電話会議または読書

23:00,:個人的な仕事、就寝

 

 

すごい早起きですね。そして目まぐるしい一日で全く退屈なんかじゃありませんよ(笑)。とても感心します。インタビューのために忙しい中お時間を割いてくださり本当にありがとうございました。これからのシュアンさんの健闘を祈ります。

 

インタビューをして、私はLQAについてさらに学ぶことが出来、なぜこんなにも急成長することが出来たのか知ることが出来ました。そしてまた、シュアンさんはとても情熱的な人で思いやりのある人だということもわかりました。シュアンがこの会社を導いていれば、LQAは成功への道を辿れるでしょう。

 

紹介ビデオ LQA Introduction をご覧ください。


Lotus Quality Assurance (LQA)

電話:(+84) 24-6660-7474
メール:[email protected]
ウェブサイト:https://www.lotus-qa.com/