業務プロセス分析を実施する際のデータ要件

ABBYY Timeline は、業務システムのログ、ビジネスプロセスのログを利用し、一連のビジネス活動を構造化して、特定のイベントを分析します。 イベントは通常、データや製品の状態が変更・変化があったタイミングで、出力されます。

ビジネスプロセスの例としては、注文の受け取り、請求、製品の出荷、従業員情報の更新、顧客へのサービスなどのイベントで構成されるような、業務の最初から最後までの一連の組合せです。 ビジネスプロセスは、組織活動の様々なレベルで発生し、顧客が目にするイベントや情報システムに隠されているイベントも含まれます。最終的なビジネス目標に向けたすべての個別ステップ(イベント)であるビジネスプロセスの組み合わせ(業務システム間のプロセスの組合せ)も指します。

ABBYY Timelineで必要とされるデータ

ABBYY Timelineは、1レコードに、3つのデータ「ケース/インシデント」、「アクティビティ/イベント」、「発生時点/時間」を含むイベントログが存在することを前提としています。 イベントログはケース(インシデント)の集合体と見なすことができ、ケース(インシデント)はイベント(アクティビティ)のトレース/シーケンスと見なすことができます。
イベントデータは、さまざまなソースから取得できます。

  • データベースシステム(例:病院の患者データ)
  • CSVファイルまたはスプレッドシート
  • トランザクションログ(例:取引システム)
  • Business Suite/ ERPシステム(SAP、Oracleなど)
  • メッセージログ(IBMミドルウェアなどから)

データセットの例

DATETIME ORDERID WORKFLOW STEP EMPLOYEE LOCATION DAY OF WEEK SHIFT
2016-02-07 10:50:00+00 100012 注文受領 戸松 フィラデルフィア 3rd
2016-02-08 00:49:00+00 100012 既存顧客登録確認 戸松 フィラデルフィア 3rd
2016-02-08 08:03:00+00 100012 在庫確認 戸松 フィラデルフィア 3rd
2016-02-09 11:40:00+00 100012 注文保留 戸松 フィラデルフィア 3rd
2016-02-11 01:39:00+00 100012 商品梱包 戸松 フィラデルフィア 3rd
2016-02-11 17:37:00+00 100012 商品発送 戸松 フィラデルフィア 3rd
2016-02-13 14:30:00+00 100012 商品受取 戸松 フィラデルフィア 3rd
2016-02-14 17:42:00+00 100012 発注処理完了 戸松 フィラデルフィア 3rd
2016-01-14 21:14:00+00 100013 注文受領 戸松 サンフランシスコ 3rd
2016-01-14 21:14:00+00 100013 既存顧客登録確認 戸松 サンフランシスコ 3rd
2016-01-15 09:39:00+00 100013 在庫確認 戸松 サンフランシスコ 3rd
2016-01-17 05:20:00+00 100013 注文保留 戸松 サンフランシスコ 3rd
2016-01-21 07:35:00+00 100013 商品梱包 戸松 サンフランシスコ 3rd
2016-01-22 00:46:00+00 100013 商品発送 戸松 サンフランシスコ 3rd
2016-01-23 05:49:00+00 100013 商品受取 戸松 サンフランシスコ 3rd
2016-01-24 09:02:00+00 100013 発注処理完了 戸松 サンフランシスコ 3rd
2016-03-04 11:49:00+00 100014 注文受領 戸松 ロサンゼルス 3rd
2016-03-05 01:22:00+00 100014 既存顧客登録確認 戸松 ロサンゼルス 3rd
2016-03-05 04:05:00+00 100014 在庫確認 戸松 ロサンゼルス 3rd
2016-03-06 05:10:00+00 100014 注文保留 戸松 ロサンゼルス 3rd
2016-03-08 13:05:00+00 100014 商品梱包 戸松 ロサンゼルス 3rd
2016-03-08 15:41:00+00 100014 商品発送 戸松 ロサンゼルス 3rd
2016-03-10 01:50:00+00 100014 商品受取 戸松 ロサンゼルス 3rd
2016-03-11 06:29:00+00 100014 発注処理完了 戸松 ロサンゼルス 3rd
2016-03-10 19:01:00+00 100015 注文受領 幕内 サンフランシスコ 3rd
2016-03-11 08:55:00+00 100015 既存顧客登録確認 幕内 サンフランシスコ 3rd
2016-03-11 17:03:00+00 100015 在庫確認 幕内 サンフランシスコ 3rd
2016-03-12 22:34:00+00 100015 注文保留 幕内 サンフランシスコ 3rd
2016-03-15 18:45:00+00 100015 商品梱包 幕内 サンフランシスコ 3rd
2016-03-16 11:05:00+00 100015 商品発送 幕内 サンフランシスコ 3rd
2016-03-17 23:36:00+00 100015 商品受取 幕内 サンフランシスコ 3rd
2016-03-19 02:40:00+00 100015 発注処理完了 幕内 サンフランシスコ 3rd
2016-01-05 03:25:00+00 100016 注文受領 取嶋 サンフランシスコ 2nd
2016-01-05 16:15:00+00 100016 既存顧客登録確認 取嶋 サンフランシスコ 2nd
2016-01-13 22:35:00+00 100016 発注処理完了 取嶋 サンフランシスコ 2nd

ABBYY Timelineのデータファイル要件

ABBYY Timelineにデータをロードする最も一般的な方法は、CSVファイルを使用することです。この文書では、必要とされるファイル構造と、ファイルの生成に関連するいくつかのヒントとコツについて説明します。

ファイル構造

データはCSVファイルに配置する必要があります。ファイルの各行は、一つのイベントを表します。(特定の時間に特定のオブジェクトに何かが発生したという記録です。)ファイルには3つの必須列が必要であり、任意の数のオプション列を含めることができます。命名規則は課されていないため、すべての列に任意の名前を付けることができますが、同じ名前の列名を付けることはできません。

必須の列:

  • TimelineID - 時間の経過とともに追跡するオブジェクト識別子。これは、注文ID、請求ID、患者の遭遇番号、サポートチケット番号などです。
  • タイムスタンプ - オブジェクトの存続期間中に何かが発生したことを示すタイムスタンプ。この列には通常、日付と時刻が含まれます(以下の形式の説明を参照)。時間のない日付が指定されている場合は、深夜(12:00 AM、00:00:00)が使用されます。
  • イベント名 - その時点でオブジェクトに何が起こったかの説明 (注文の送信、患者の出発、調整割り当て、チケットのエスカレーションなど)

オプションの列:

必須の列に加えて、ファイルにはイベントに付随する属性として使用される列をいくつでも追加することができます。これらのフィールドでフィルタリングしたり、グループ化して分類したり、プロセスを分析する際の追加情報として使用したりできます。


レコードの順序

ファイル内のレコードの順序は重要ではありません。但し、同じオブジェクトに関連する複数のレコードのタイムスタンプがまったく同じである場合、アプリケーションはそれらをファイルに配置された順序で保持します。

ファイルサンプル

TIMELINEID TIMESTAMP EVENT NAME EMPLOYEE LOCATION
A 1/16/2017 7:20:15 生徒申込受付 John ボストン
A 3/10/2017 16:54:10 生徒申込認可 Mary ボストン
A 4/11/2017 15:04:00 請求書作成 Ann シャーロット
B 2/1/2017 9:15:00 生徒申込受付 John ボストン
B 3/2/2017 16:20:05 生徒申込認可 Mary ボストン

上記では、生徒受入の例を示しており、AとBは、追跡可能なオブジェクトの識別子です。イベント名は「生徒申込受付、生徒申込認可」などです。

CSVファイルでは、次のようになります。

TimelineID,Timestamp,Event name,Employee,Location
A,1/16/2017 7:20:15,生徒申込受付,John,ボストン
A,3/10/2017 16:54:10,生徒申込認可,Mary,ボストン
A,4/11/2017 15:04:00,請求書作成,Ann,シャーロット
B,2/1/2017 9:15:00,生徒申込受付,John,ボストン
B,3/2/2017 16:20:05,生徒申込認可,Mary,ボストン

よくある問題・留意点

データファイルに関する最も一般的な問題は、日付/時刻の形式が正しくないこととファイル形式が壊れていることです。

日付/時刻形式の問題

  • 1/6/2017 7:20:15
  • 1/6/2017 7:20:15 AM
  • 2017-01-06 7:20:15
  • 2017-01-06T7:20:15Z

タイムスタンプは、上記形式のいずれかでファイルに保存してください。 Excelのデフォルトの時間形式には秒が含まれていないことに注意してください。秒をCSVファイルに保存するには、Excelでカスタム形式に切り替え、「m/d/yyyy h:mm」を選択して「m/d/yyyy h:mm:ss」に変更します。

ファイル形式の留意点

いずれかのフィールドの値にコンマが含まれていると、ファイルの形式が崩れる可能性があります。これを回避するには、文字列修飾子として二重引用符を指定してください。 Excelは自動的にそれを行いますが、MS SQLエクスポートウィザードなどの一部のツールでは、以下に示すような手動設定が必要です。

ファイルは、ロケール英語(米国)およびUS ASCIIまたはUTF-8でエンコードされている必要があります。

03______.png

この記事は役に立ちましたか?

0人中0人がこの記事が役に立ったと言っています

他にご質問がございましたら、リクエストを送信してください

最近の閲覧