@things-factory/dataset 6.2.58 → 6.2.61

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (66) hide show
  1. package/client/activities/activity-data-collect-edit.ts +1 -0
  2. package/client/activities/activity-data-collect-view.ts +1 -0
  3. package/client/activities/activity-ooc-resolve-edit.ts +1 -0
  4. package/client/activities/activity-ooc-resolve-view.ts +1 -0
  5. package/client/activities/activity-ooc-review-edit.ts +1 -0
  6. package/client/activities/activity-ooc-review-view.ts +1 -0
  7. package/client/pages/data-entry/data-entry-list-page.ts +1 -0
  8. package/client/pages/data-report/data-report-list-page.ts +1 -0
  9. package/client/pages/data-set/data-item-list.ts +9 -0
  10. package/client/pages/data-set/data-set-list-page.ts +1 -0
  11. package/client/pages/data-summary/data-summary-period-page.ts +1 -0
  12. package/client/pages/data-summary/data-summary-search-page.ts +1 -0
  13. package/client/pages/data-summary/data-summary-view.ts +1 -0
  14. package/dist-client/activities/activity-data-collect-edit.js +1 -0
  15. package/dist-client/activities/activity-data-collect-edit.js.map +1 -1
  16. package/dist-client/activities/activity-data-collect-view.js +1 -0
  17. package/dist-client/activities/activity-data-collect-view.js.map +1 -1
  18. package/dist-client/activities/activity-ooc-resolve-edit.js +1 -0
  19. package/dist-client/activities/activity-ooc-resolve-edit.js.map +1 -1
  20. package/dist-client/activities/activity-ooc-resolve-view.js +1 -0
  21. package/dist-client/activities/activity-ooc-resolve-view.js.map +1 -1
  22. package/dist-client/activities/activity-ooc-review-edit.js +1 -0
  23. package/dist-client/activities/activity-ooc-review-edit.js.map +1 -1
  24. package/dist-client/activities/activity-ooc-review-view.js +1 -0
  25. package/dist-client/activities/activity-ooc-review-view.js.map +1 -1
  26. package/dist-client/pages/data-entry/data-entry-list-page.js +1 -0
  27. package/dist-client/pages/data-entry/data-entry-list-page.js.map +1 -1
  28. package/dist-client/pages/data-report/data-report-list-page.js +1 -0
  29. package/dist-client/pages/data-report/data-report-list-page.js.map +1 -1
  30. package/dist-client/pages/data-set/data-item-list.js +9 -0
  31. package/dist-client/pages/data-set/data-item-list.js.map +1 -1
  32. package/dist-client/pages/data-set/data-set-list-page.js +1 -0
  33. package/dist-client/pages/data-set/data-set-list-page.js.map +1 -1
  34. package/dist-client/pages/data-summary/data-summary-period-page.js +1 -0
  35. package/dist-client/pages/data-summary/data-summary-period-page.js.map +1 -1
  36. package/dist-client/pages/data-summary/data-summary-search-page.js +1 -0
  37. package/dist-client/pages/data-summary/data-summary-search-page.js.map +1 -1
  38. package/dist-client/pages/data-summary/data-summary-view.js +1 -0
  39. package/dist-client/pages/data-summary/data-summary-view.js.map +1 -1
  40. package/dist-client/tsconfig.tsbuildinfo +1 -1
  41. package/dist-server/controllers/create-data-sample.js +22 -24
  42. package/dist-server/controllers/create-data-sample.js.map +1 -1
  43. package/dist-server/service/data-set/data-item-type.js +46 -20
  44. package/dist-server/service/data-set/data-item-type.js.map +1 -1
  45. package/dist-server/service/data-set/data-set.js +54 -30
  46. package/dist-server/service/data-set/data-set.js.map +1 -1
  47. package/dist-server/tsconfig.tsbuildinfo +1 -1
  48. package/helps/dataset/data-set.ja.md +103 -0
  49. package/helps/dataset/data-set.ko.md +101 -0
  50. package/helps/dataset/data-set.md +103 -43
  51. package/helps/dataset/data-set.ms.md +103 -0
  52. package/helps/dataset/data-set.zh.md +103 -0
  53. package/helps/dataset/ui/data-item-list.ja.md +91 -0
  54. package/helps/dataset/ui/data-item-list.ko.md +90 -0
  55. package/helps/dataset/ui/data-item-list.md +88 -26
  56. package/helps/dataset/ui/data-item-list.ms.md +90 -0
  57. package/helps/dataset/ui/data-item-list.zh.md +88 -0
  58. package/package.json +2 -2
  59. package/server/controllers/create-data-sample.ts +23 -25
  60. package/server/service/data-set/data-item-type.ts +48 -20
  61. package/server/service/data-set/data-set.ts +56 -30
  62. package/translations/en.json +3 -2
  63. package/translations/ja.json +1 -0
  64. package/translations/ko.json +3 -2
  65. package/translations/ms.json +1 -0
  66. package/translations/zh.json +3 -2
@@ -0,0 +1,103 @@
1
+ # 데이터셋 (データセット)
2
+
3
+ データセットはさまざまな設定と情報を通じて定義されます。以下では、データセットに関連する各フィールドと設定オプションについての詳細な説明を提供します。
4
+
5
+ - **名前 (name)**: データセットの名前を設定します。この名前はデータセットを固有に識別するために使用されます。
6
+
7
+ - **説明 (description)**: データセットについての説明を設定します。データセットの目的、内容、または特徴を説明するために使用されます。
8
+
9
+ - **タイプ (type)**: データセットのタイプを設定します。2 つのオプションのうち一つを選択できます。
10
+
11
+ - **手動収集 (Manual)**: ユーザーが直接データを入力するデータセットを表します。
12
+ - **自動収集 (Automatic)**: センサーなどの自動化された方法を通じてデータが収集されるデータセットを表します。
13
+
14
+ - **データキーセット (dataKeySet)**: データキーセットマスターページで登録した項目を選択して適用します。データキーセットはデータセットで使用されるデータフィールドおよび属性を定義します。
15
+
16
+ - **パーティションキー (partitionKeys)**: データを分割し構成するために使用されるパーティションキーを設定します。パーティションキーはデータを論理的にグループ化し保存し、データを管理し検索するための効率性を提供します。パーティションキーを活用することでデータを迅速にフィルタリングしクエリできます。
17
+
18
+ - **スケジュール (schedule)**: データ入力周期を設定します。入力周期が設定されると、その周期ごとにデータ入力作業が実行されます。
19
+
20
+ - **タイムゾーン (timezone)**: スケジュールが適用される基準タイムゾーンを設定します。時間帯変換と関連する作業に使用されます。
21
+
22
+ - **管理者役割 (supervisoryRole)**: データセットの管理者役割を設定します。管理者はデータセットに対する権限と責任を持ちます。
23
+
24
+ - **入力担当役割 (entryRole)**: 入力権限を持つ役割を設定します。データ入力作業を行う役割を表します。
25
+
26
+ - **入力用画面の種類 (entryType)**: 入力画面の種類を設定します。次のオプションの中から一つを選択できます。
27
+
28
+ - **Generated**: 実装された画面を自動的に使用します。
29
+ - **Board**: Board 画面を使用します。
30
+ - **Page**: 実装されたページに移動します。サブ URL(suburl)が必要です。
31
+ - **External URL**: 外部ページに移動します。完全な URL が必要です。
32
+
33
+ - **入力用画面 (entryView)**: 入力画面の種類に応じて値を設定します。Board 画面の種類を選択する場合、対応する値を設定できます。
34
+
35
+ - **モニター用画面の種類 (monitorType)**: モニター用画面の種類を設定します。入力画面
36
+
37
+ の種類と同じオプションを提供します。
38
+
39
+ - **モニター用画面 (monitorView)**: モニター用画面の種類に該当する値を設定します。
40
+
41
+ - **レポート用画面の種類 (reportType)**: レポート用画面の種類を設定します。入力画面の種類と部分的に共有するオプションを提供します。
42
+
43
+ - **Jasper**: Jasper サーバー設定に従い Jasper レポートページをレンダリングし、報告書を生成します。
44
+ - **Shiny**: Shiny サーバー設定に従い Shiny アプリケーションページをレンダリングし、報告書を生成します。
45
+
46
+ - **レポート用画面 (reportView)**: レポート用画面の種類に合った値を設定します。Jasper や Shiny のような場合、該当サーバーで有効なサブ URL(suburl)が必要です。
47
+
48
+ - **レポート用テンプレート (reportTemplate)**: レポート用画面に必要なテンプレートファイルをアップロードします。
49
+
50
+ - **担当者 (assignees)**: 異常データ処理承認線に対する問い合わせを受ける担当者を設定します。
51
+
52
+ - **確認承認ライン (reviewApprovalLine)**: データセット確認のための承認ラインを設定します。
53
+
54
+ - **異常データ処理承認線 (outlierApprovalLine)**: 異常データ処理のための承認ラインを設定します。
55
+
56
+ - **使用事例 (useCase)**: データセットの用途や目的を示します。"QA," "CCP," "SPC"などの一般的な使用事例オプションを含みます。
57
+
58
+ - **データ項目 (dataItems)**: データセットに関するデータ項目を設定します。
59
+
60
+ - **データ入力スケジュール (schedule)**: データ入力周期を設定します。
61
+
62
+ - **データ入力タイムゾーン (timezone)**: データセットの入力に関連するタイムゾーンを設定します。
63
+
64
+ - **レビュー必要性 (requiresReview)**: データセットがレビューが必要かどうかを示します。
65
+
66
+ - **スケジュール ID (scheduleId)**: データセットのスケジュール ID を設定します。
67
+
68
+ - **サマリー周期 (summaryPeriod)**: サマリー周期を設定すると、自動的にスケジューラーにサマリー作業が登録されます。現在は週刊、月刊周期サマリーは作業負荷を考慮し提供していません。周期オプションには hour(毎時)、shift(毎作業班)、workdate(毎作業日)、daily(毎日)があります。
69
+
70
+ - **次のサマリー実行日時 (summarySchedule)**: 設定されたサマリー周期を基準に次のサマリー実行日時を知らせます。設定された周期に従いサマリー作業が実行されます。
71
+
72
+ - **作成日 (createdAt)**: データセットが作成された日付と時間を示します。
73
+
74
+ - **最終更新日 (updatedAt)**: データセットが最後に更新された日付と時間を示します。
75
+
76
+ - **作成者 (creator)**: データセットを作成したユーザーを示します。
77
+
78
+ - **更新者 (updater)**: データセットを最後に更新したユーザーを示します。
79
+
80
+ これらの設定と情報は、データセットの定義と使用に役立ち、データセットの目的と使用法を明確に理解するのに役立ちます。
81
+
82
+ ## パーティションキー (partitionKey) の使用例
83
+
84
+ **パーティションキーの使用例 (Athena API):**
85
+
86
+ Athena は、Amazon Web Services (AWS) のクエリサービスの一つで、S3 に保存されたデータを簡単にクエリし分析することができます。パーティションキーを使用して、Athena でデータを迅速に検索しフィルタリングする方法を見ていきましょう。
87
+
88
+ 仮定:
89
+
90
+ - データセットは、日々の注文データを保存しています。
91
+ - パーティションキーは「日付 (Date)」として設定されています。
92
+
93
+ **Athena クエリ例:**
94
+
95
+ 以下は、特定の日付の注文データを検索するために Athena を使用したクエリの例です。
96
+
97
+ ```sql
98
+ SELECT *
99
+ FROM "my_dataset"
100
+ WHERE "partition_key" = '2023-12-01';
101
+ ```
102
+
103
+ このクエリは、「my_dataset」データセット内で「日付 (Date)」パーティションキーが '2023-12-01'であるすべての注文データを検索します。パーティションキーを使用すると、大規模なデータセットでも迅速に目的のデータを検索することができます。
@@ -0,0 +1,101 @@
1
+ # 데이터셋 (DataSet)
2
+
3
+ 데이터셋은 다양한 설정과 정보를 통해 정의됩니다. 아래에서는 데이터셋과 관련된 각 필드와 설정 옵션에 대한 상세 설명을 제공합니다.
4
+
5
+ - **이름 (name)**: 데이터셋의 이름을 설정합니다. 이 이름은 데이터셋을 고유하게 식별하는 데 사용됩니다.
6
+
7
+ - **설명 (description)**: 데이터셋에 대한 설명을 설정합니다. 데이터셋의 목적, 내용 또는 특징을 설명하는 데 사용됩니다.
8
+
9
+ - **유형 (type)**: 데이터셋의 유형을 설정합니다. 두 가지 옵션 중 하나를 선택할 수 있습니다.
10
+
11
+ - **수동 수집 (Manual)**: 사용자가 직접 데이터를 입력하는 데이터셋을 나타냅니다.
12
+ - **자동 수집 (Automatic)**: 센서와 같은 자동화된 방법을 통해 데이터가 수집되는 데이터셋을 나타냅니다.
13
+
14
+ - **데이터 키셋 (dataKeySet)**: 데이터 키셋 마스터 페이지에서 등록한 항목을 선택하여 적용합니다. 데이터 키셋은 데이터셋에서 사용될 데이터 필드 및 속성을 정의합니다.
15
+
16
+ - **파티션 키 (partitionKeys)**: 데이터를 분할하고 구성하는 데 사용되는 파티션 키를 설정합니다. 파티션 키는 데이터를 논리적으로 그룹화하고 저장하며, 데이터를 관리하고 검색하는 데 효율성을 제공합니다. 파티션 키를 활용하면 데이터를 빠르게 필터링하고 쿼리할 수 있습니다.
17
+
18
+ - **스케줄 (schedule)**: 데이터 입력 주기를 설정합니다. 입력 주기가 설정되면 해당 주기마다 데이터 입력 작업이 수행됩니다.
19
+
20
+ - **타임존 (timezone)**: 스케줄이 적용될 기준 타임존을 설정합니다. 시간대 변환과 관련된 작업에 사용됩니다.
21
+
22
+ - **관리자 역할 (supervisoryRole)**: 데이터셋의 관리자 역할을 설정합니다. 관리자는 데이터셋에 대한 권한과 책임을 가집니다.
23
+
24
+ - **입력 담당 역할 (entryRole)**: 입력 권한을 가진 역할을 설정합니다. 데이터 입력 작업을 수행하는 역할을 나타냅니다.
25
+
26
+ - **입력용 화면 종류 (entryType)**: 입력 화면 종류를 설정합니다. 다음 옵션 중 하나를 선택할 수 있습니다.
27
+
28
+ - **Generated**: 구현된 화면을 자동으로 사용합니다.
29
+ - **Board**: Board 화면을 사용합니다.
30
+ - **Page**: 구현된 페이지로 이동합니다. 서브 URL(suburl)이 필요합니다.
31
+ - **External URL**: 외부 페이지로 이동합니다. 전체 URL이 필요합니다.
32
+
33
+ - **입력용 화면 (entryView)**: 입력 화면 종류에 따라 값을 설정합니다. Board 화면 종류를 선택하면 해당하는 값을 설정할 수 있습니다.
34
+
35
+ - **모니터용 화면 종류 (monitorType)**: 모니터용 화면 종류를 설정합니다. 입력 화면 종류와 동일한 옵션을 제공합니다.
36
+
37
+ - **모니터용 화면 (monitorView)**: 모니터용 화면 종류에 해당하는 값을 설정합니다.
38
+
39
+ - **리포트용 화면 종류 (reportType)**: 리포트용 화면 종류를 설정합니다. 입력 화면 종류와 부분적으로 공유하는 옵션을 제공합니다.
40
+
41
+ - **Jasper**: Jasper 서버 설정에 따라 Jasper 리포트 페이지를 렌더링하여 보고서를 생성합니다.
42
+ - **Shiny**: Shiny 서버 설정에 따라 Shiny 애플리케이션 페이지를 렌더링하여 보고서를 생성합니다.
43
+
44
+ - **리포트용 화면 (reportView)**: 리포트용 화면 종류에 맞는 값을 설정합니다. Jasper나 Shiny와 같은 경우 해당 서버에서 유효한 서브 URL(suburl)이 필요합니다.
45
+
46
+ - **리포트용 템플릿 (reportTemplate)**: 리포트용 화면에 필요한 템플릿 파일을 업로드합니다.
47
+
48
+ - **할당자 (assignees)**: 이상치 데이터 처리 결재선에 대한 문의를 받을 담당자를 설정합니다.
49
+
50
+ - **확인 승인 라인 (reviewApprovalLine)**: 데이터셋 확인을 위한 승인 라인을 설정합니다.
51
+
52
+ - **이상치 데이타 처리 결재선 (outlierApprovalLine)**: 이상치 데이터 처리를 위한 승인 라인을 설정합니다.
53
+
54
+ - **사용 사례 (useCase)**: 데이터셋의 용도나 목적을 나타냅니다. "QA," "CCP," "SPC"와 같은 공통 사용 사례 옵션을 포함합니다.
55
+
56
+ - **데이터 항목 (dataItems)**: 데이터셋에 대한 데이터 항목을 설정합니다.
57
+
58
+ - **데이터 입력 일정 (schedule)**: 데이터 입력 주기를 설정합니다.
59
+
60
+ - **데이터 입력 타임존 (timezone)**: 데이터셋의 입력과 관련된 타임존을 설정합니다.
61
+
62
+ - **리뷰 필요 여부 (requiresReview)**: 데이터셋이 리뷰가 필요한지 여부를 나타냅니다.
63
+
64
+ - **스케줄 ID (scheduleId)**: 데이터셋의 스케줄 ID를 설정합니다.
65
+
66
+ - **서머리 주기 (summaryPeriod)**: 서머리 주기를 설정하면 자동으로 스케줄러에 서머리 작업이 등록됩니다. 현재는 주별, 월별 주기 서머리는 작업 부하를 고려하여 제공하지 않습니다. 주기 옵션으로는 hour(매시간), shift(매 작업조), workdate(매 작업일), daily(매일)이 있습니다.
67
+
68
+ - **다음 서머리 실행 일시 (summarySchedule)**: 설정된 서머리 주기를 기준으로 다음 서머리 실행 일시를 알려줍니다. 설정된 주기에 따라 서머리 작업이 수행됩니다.
69
+
70
+ - **생성일 (createdAt)**: 데이터셋이 생성된 날짜와 시간을 나타냅니다.
71
+
72
+ - **최종 업데이트일 (updatedAt)**: 데이터셋이 마지막으로 업데이트된 날짜와 시간을 나타냅니다.
73
+
74
+ - **생성자 (creator)**: 데이터셋을 생성한 사용자를 나타냅니다.
75
+
76
+ - **업데이터 (updater)**: 데이터셋을 마지막으로 업데이트한 사용자를 나타냅니다.
77
+
78
+ 이러한 설정과 정보는 데이터셋을 정의하고 데이터셋을 사용하는 데 도움이 되며, 데이터셋의 목적과 용도를 명확하게 이해할 수 있도록 도와줍니다.
79
+
80
+ ## 파티션키(partitionKey) 활용 예시
81
+
82
+ **파티션 키 활용 예시 (Athena API):**
83
+
84
+ Athena는 Amazon Web Services (AWS)의 쿼리 서비스 중 하나로, S3에 저장된 데이터를 쉽게 쿼리하고 분석할 수 있습니다. 파티션 키를 사용하여 Athena에서 데이터를 빠르게 검색하고 필터링하는 방법을 살펴보겠습니다.
85
+
86
+ 가정:
87
+
88
+ - 데이터셋은 일일 주문 데이터를 저장합니다.
89
+ - 파티션 키는 "날짜 (Date)"로 설정되어 있습니다.
90
+
91
+ **Athena 쿼리 예시:**
92
+
93
+ 다음은 Athena를 사용하여 특정 날짜의 주문 데이터를 검색하는 쿼리의 예시입니다.
94
+
95
+ ```sql
96
+ SELECT *
97
+ FROM "my_dataset"
98
+ WHERE "partition_key" = '2023-12-01';
99
+ ```
100
+
101
+ 이 쿼리는 "my_dataset" 데이터셋에서 "날짜" 파티션 키가 '2023-12-01'인 모든 주문 데이터를 검색합니다. 파티션 키를 활용하면 대용량 데이터 세트에서도 빠르게 원하는 데이터를 검색할 수 있습니다.
@@ -1,43 +1,103 @@
1
- # 데이터셋 (DataSet)
2
-
3
- 데이타 셋을 정의합니다.<br>
4
-
5
- - [`데이타 아이템 등록 조회`](./ui/data-item-list.md): 데이타 아이템 화면을 팝업으로 띄웁니다.
6
- - 데이타 입력: 데이타 입력 화면을 팝업으로 띄웁니다.
7
- - 이름: 데이터셋 이름을 설정합니다.<br>
8
- - 설명: 데이터셋에 대한 설명을 설정합니다.<br>
9
- - 유형: 데이터셋 유형을 설정합니다.<br>
10
- - 수동 수집: 사용자가 입력하는 데이터셋인 경우
11
- - 자동 수집: 센서처럼 자동으로 입력되는 데이터셋인 경우
12
- - 데이타 키셋: 데이타 키셋 마스터 페이지에서 등록한 항목을 적용합니다.<br>
13
- - 파티션 키: (deprecated 예정)<br>
14
- - 스케줄: 입력 주기를 설정합니다.<br>
15
- - 입력 주기가 설정되면, 설정된 주기마다 입력담당 역할자에게 데이타 입력 태스크가 할당됩니다.
16
- - 타임존: 스케쥴이 반영될 기준 타임존을 설정합니다.<br>
17
- - 관리자 역할: 데이터셋 관리자 역할을 설정합니다.<br>
18
- - 입력담당 역할: 입력 권한을 부여할 역할을 설정합니다.<br>
19
- - 입력용 화면종류: 입력 화면종류를 설정합니다. 주로 Board가 사용됩니다.<br>
20
- - Generated: 구현된 화면을 사용합니다.
21
- - Board: Board 화면을 사용합니다.
22
- - Page: 구현된 페이지로 이동합니다. suburl이 필요합니다.
23
- - External URL: 외부 페이지로 이동합니다. 전체 Url이 필요합니다.
24
- - 입력용 화면: 화면 종류에 따른 값을 설정합니다. Board 화면 종류는 Board를 선택할 있습니다.<br>
25
- - 모니터용 화면종류: 모니터용 화면종류를 설정합니다. 선택 목록은 입력용 화면종류와 동일합니다.<br>
26
- - 모니터용 화면: 모니터용 화면종류에 해당하는 값을 설정합니다. <br>
27
- - 리포트용 화면종류: 리포트용 화면종류를 설정합니다. 선택 목록은 입력용 화면종류에 두 종류가 더 있습니다.
28
- - Jasper: Jasper 서버 설정에 따른 jasper 페이지를 렌더링합니다.
29
- - Shiny: shiny 서버 설정에 따른 shiny 페이지를 렌더링합니다.
30
- - 리포트용 화면: 리포트용 화면종류에 맞는 값을 설정합니다. Jasper나 Shiny의 경우, 해당 서버에서 유효한 suburl 필요합니다. <br>
31
- - 리포트용 템플릿: 리포트용 화면에 필요한 템플릿 파일을 업로드합니다.
32
- - 서머리 주기
33
- - 서머리 주기가 설정되면, 자동으로 스케쥴러에 서머리 작업이 등록됩니다.
34
- - 현재는 주별, 월별 주기 서머리는 작업의 부하를 고려해서 제공하지 않습니다.
35
- - 데이터 키셋으로 그룹핑되어서 서머리 레코드가 생성됩니다.
36
- - 주기
37
- - hour : 매시간 서머리 작업 진행
38
- - shift : 매 작업조별로 진행
39
- - workdate : 작업일 기준
40
- - daily : 매일
41
- - 다음 서머리 실행 일시
42
- - 설정된 서머리 주기를 기준으로 다음 서머리 실행 일시를 알려줍니다.
43
- - 서머리 주기는 설정되었지만, 스케쥴러에 등록되지 않았다면, 등록버튼이 보여지므로 버튼을 눌러서 등록합니다. 등록이 성공되면 다음 스케쥴이 표시됩니다.
1
+ # DataSet
2
+
3
+ DataSets are defined through various settings and information. Below is a detailed description of each field and setting option related to DataSets.
4
+
5
+ - **Name (name)**: Set the name of the DataSet. This name is used to uniquely identify the DataSet.
6
+
7
+ - **Description (description)**: Set a description of the DataSet. Used to explain the purpose, content, or features of the DataSet.
8
+
9
+ - **Type (type)**: Set the type of DataSet. You can choose one of two options:
10
+
11
+ - **Manual (Manual)**: Represents a DataSet where users enter data directly.
12
+ - **Automatic (Automatic)**: Represents a DataSet where data is collected through automated methods, such as sensors.
13
+
14
+ - **Data Key Set (dataKeySet)**: Apply items registered on the Data Key Set master page to the DataSet. The Data Key Set defines the data fields and properties to be used in the DataSet.
15
+
16
+ - **Partition Keys (partitionKeys)**: Set partition keys used to divide and organize data. Partition keys logically group and store data and provide efficiency in data management and retrieval. Using partition keys, data can be quickly filtered and queried.
17
+
18
+ - **Schedule (schedule)**: Set the data input cycle. Once the cycle is set, data input tasks will be performed according to that cycle.
19
+
20
+ - **Timezone (timezone)**: Set the reference timezone for the schedule. Used for time zone conversion related tasks.
21
+
22
+ - **Supervisory Role (supervisoryRole)**: Set the supervisory role for the DataSet. The supervisor has authority and responsibility for the DataSet.
23
+
24
+ - **Entry Role (entryRole)**: Set the role with input authority. Represents the role that performs data input tasks.
25
+
26
+ - **Entry Type (entryType)**: Set the type of entry screen. You can choose one of the following options:
27
+
28
+ - **Generated**: Automatically use the implemented screen.
29
+ - **Board**: Use the Board screen.
30
+ - **Page**: Move to the implemented page. A sub URL (suburl) is needed.
31
+ - **External URL**: Move to an external page. A full URL is needed.
32
+
33
+ - **Entry View (entryView)**: Set the value according to the type of entry screen. If the Board screen type is selected, the corresponding value can be set.
34
+
35
+ - **Monitor Type (monitorType)**: Set the type of monitor screen. Provides the same options as the entry screen type.
36
+
37
+ - **Monitor View (monitorView)**: Set the value according to the type of monitor screen.
38
+
39
+ - **Report Type (reportType)**: Set the type of report screen. Partially shares options with the entry screen type.
40
+
41
+ - **Jasper**: Render a Jasper report page according to Jasper server settings to generate a report.
42
+ - **Shiny**: Render a Shiny application page according to Shiny server settings to generate a report.
43
+
44
+ - **Report View (reportView)**: Set the value according to the type of report screen. In the case of Jasper or Shiny, a valid sub URL (suburl) on the respective server is needed.
45
+
46
+ - **Report Template (reportTemplate)**: Upload the template file required for the report screen.
47
+
48
+ - **Assignees (assignees)**: Set the person in charge of handling inquiries for the approval line for outlier data processing.
49
+
50
+ - **Review Approval Line (reviewApprovalLine)**: Set the approval line for DataSet verification.
51
+
52
+ - **Outlier Approval Line (outlierApprovalLine)**: Set the approval line for outlier data processing.
53
+
54
+ - **Use Case (useCase)**: Indicates the purpose or use of the DataSet. Includes common use case options like "QA," "CCP," "SPC."
55
+
56
+ - **Data Items (dataItems)**: Set the data items for the DataSet.
57
+
58
+ - **Data Entry Schedule (schedule)**: Set the data entry cycle.
59
+
60
+ - **Data Entry Timezone (timezone)**: Set the timezone related to data entry for the DataSet.
61
+
62
+ - **Requires Review (requiresReview)**: Indicates whether the DataSet requires a review.
63
+
64
+ - **Schedule ID (scheduleId)**: Set the schedule ID for the DataSet.
65
+
66
+ - **Summary Period (summaryPeriod)**: Setting a summary period automatically registers a summary task in the scheduler. Currently, weekly and monthly period summaries are not provided considering workload. Period options include hour (hour), shift (shift), workdate (workdate), and daily (daily).
67
+
68
+ - **Next Summary Execution Date (summarySchedule)**: Notify the next summary execution date based on the set summary period. Summary tasks are performed according to the set cycle.
69
+
70
+ - **Creation Date (createdAt)**: Indicates the date and time the DataSet was created.
71
+
72
+ - **Last Update Date (updatedAt)**: Indicates the date and time the DataSet was last updated.
73
+
74
+ - **Creator (creator)**: Indicates the user who created the DataSet.
75
+
76
+ - **Updater (updater)**: Indicates the user who last updated the DataSet.
77
+
78
+ These settings and information help define the DataSet and use it, aiding in a clear understanding of the DataSet's purpose and use.
79
+
80
+ ## Partition Key Utilization Example (
81
+
82
+ partitionKey)
83
+
84
+ **Partition Key Utilization Example (Athena API):**
85
+
86
+ Athena is one of Amazon Web Services (AWS)'s query services, which allows easy querying and analysis of data stored in S3. Let's look at how to use a partition key in Athena to quickly search and filter data.
87
+
88
+ Assumptions:
89
+
90
+ - The DataSet stores daily order data.
91
+ - The partition key is set as "Date."
92
+
93
+ **Athena Query Example:**
94
+
95
+ Here is an example of a query using Athena to retrieve order data for a specific date.
96
+
97
+ ```sql
98
+ SELECT *
99
+ FROM "my_dataset"
100
+ WHERE "partition_key" = '2023-12-01';
101
+ ```
102
+
103
+ This query searches for all order data in the "my_dataset" DataSet where the "Date" partition key is '2023-12-01'. Utilizing the partition key allows for quick searching of desired data even in large data sets.
@@ -0,0 +1,103 @@
1
+ # Dataset (DataSet)
2
+
3
+ Dataset didefinisikan melalui pelbagai tetapan dan maklumat. Berikut adalah penerangan terperinci mengenai setiap bidang dan pilihan tetapan yang berkaitan dengan dataset.
4
+
5
+ - **Nama (name)**: Menetapkan nama dataset. Nama ini digunakan untuk mengenal pasti dataset secara unik.
6
+
7
+ - **Penerangan (description)**: Menetapkan penerangan mengenai dataset. Digunakan untuk menjelaskan tujuan, kandungan, atau ciri-ciri dataset.
8
+
9
+ - **Jenis (type)**: Menetapkan jenis dataset. Anda boleh memilih salah satu daripada dua pilihan.
10
+
11
+ - **Pengumpulan Manual (Manual)**: Mewakili dataset di mana data dimasukkan secara manual oleh pengguna.
12
+ - **Pengumpulan Automatik (Automatic)**: Mewakili dataset di mana data dikumpulkan melalui cara automatik seperti sensor.
13
+
14
+ - **Set Kunci Data (dataKeySet)**: Pilih item yang didaftarkan dalam halaman utama set kunci data. Set kunci data menentukan medan dan atribut data yang akan digunakan dalam dataset.
15
+
16
+ - **Kunci Partisi (partitionKeys)**: Menetapkan kunci partisi yang digunakan untuk membahagi dan mengatur data. Kunci partisi mengelompokkan dan menyimpan data secara logik, dan menyediakan kecekapan dalam mengurus dan mencari data. Penggunaan kunci partisi membolehkan penyaringan dan pertanyaan data dengan cepat.
17
+
18
+ - **Jadual (schedule)**: Menetapkan kitaran masukan data. Apabila kitaran masukan ditetapkan, tugas masukan data akan dilaksanakan pada setiap kitaran.
19
+
20
+ - **Zon Waktu (timezone)**: Menetapkan zon waktu rujukan untuk jadual. Digunakan untuk tugas yang berkaitan dengan penukaran zon waktu.
21
+
22
+ - **Peranan Penyelia (supervisoryRole)**: Menetapkan peranan penyelia dataset. Penyelia mempunyai kuasa dan tanggungjawab ke atas dataset.
23
+
24
+ - **Peranan Penginputan (entryRole)**: Menetapkan peranan yang mempunyai kebenaran penginputan. Mewakili peranan yang menjalankan tugas penginputan data.
25
+
26
+ - **Jenis Skrin Penginputan (entryType)**: Menetapkan jenis skrin penginputan. Anda boleh memilih salah satu daripada pilihan berikut.
27
+
28
+ - **Generated**: Menggunakan skrin yang diimplementasikan secara automatik.
29
+ - **Board**: Menggunakan skrin Board.
30
+ - **Page**: Pergi ke halaman yang diimplementasikan. Suburl diperlukan.
31
+ - **URL Luaran**: Pergi ke halaman luar. URL penuh diperlukan.
32
+
33
+ - **Skrin Penginputan (entryView)**: Menetapkan nilai bergantung pada jenis skrin penginputan. Jika jenis skrin Board dipilih, anda boleh menetapkan nilai yang sesuai.
34
+
35
+ - **Jenis Skrin Pemantauan (monitorType)**: Menetapkan jenis skrin pemantauan. Menawarkan pilihan yang sama dengan jenis skrin penginputan.
36
+
37
+ - **Skrin Pemantauan (monitorView)**: Menetapkan nilai yang sesuai dengan jenis skrin pemantauan.
38
+
39
+ - **Jenis Skrin Laporan (reportType)**: Menetapkan jenis skrin laporan. Menawarkan beberapa pilihan yang sama dengan jenis skrin penginputan.
40
+
41
+ - **Jasper**: Menghasilkan laporan dengan merender halaman laporan Jasper berdasarkan tetapan pelayan Jasper.
42
+ - **Shiny**: Menghasilkan laporan dengan merender aplikasi halaman Shiny berdasarkan tetapan pelayan Shiny.
43
+
44
+ - **Skrin Laporan (reportView)**: Menetapkan nilai yang sesuai dengan jenis skrin laporan. Dalam kes Jasper atau Shiny, suburl yang sah dari pelayan tersebut diperlukan.
45
+
46
+ - **Templat Laporan (reportTemplate)**: Memuat naik fail templat yang diperlukan untuk skrin laporan.
47
+
48
+ - **Penugasan (assignees)**: Menetapkan orang yang bertanggungjawab untuk menangani pertanyaan mengenai data anomali.
49
+
50
+ - **Barisan Kelulusan Semakan (reviewApprovalLine)**: Menetapkan barisan kelulusan untuk semakan dataset.
51
+
52
+ - \*\*Barisan Kel
53
+
54
+ ulusan Pemprosesan Data Anomali (outlierApprovalLine)\*\*: Menetapkan barisan kelulusan untuk pemprosesan data anomali.
55
+
56
+ - **Kegunaan (useCase)**: Menunjukkan kegunaan atau tujuan dataset. Termasuk pilihan kegunaan umum seperti "QA," "CCP," "SPC."
57
+
58
+ - **Item Data (dataItems)**: Menetapkan item data untuk dataset.
59
+
60
+ - **Jadual Penginputan Data (schedule)**: Menetapkan kitaran penginputan data.
61
+
62
+ - **Zon Waktu Penginputan Data (timezone)**: Menetapkan zon waktu yang berkaitan dengan penginputan dataset.
63
+
64
+ - **Keperluan Semakan (requiresReview)**: Menunjukkan sama ada dataset memerlukan semakan.
65
+
66
+ - **ID Jadual (scheduleId)**: Menetapkan ID jadual dataset.
67
+
68
+ - **Kitaran Ringkasan (summaryPeriod)**: Apabila kitaran ringkasan ditetapkan, tugas ringkasan secara automatik didaftarkan dalam penjadual. Saat ini, ringkasan mingguan dan bulanan tidak ditawarkan kerana beban kerja. Pilihan kitaran termasuk jam (hour), shift (shift), hari kerja (workdate), dan harian (daily).
69
+
70
+ - **Tarikh dan Masa Pelaksanaan Ringkasan Seterusnya (summarySchedule)**: Menunjukkan tarikh dan masa pelaksanaan ringkasan seterusnya berdasarkan kitaran ringkasan yang ditetapkan. Tugas ringkasan akan dilaksanakan mengikut kitaran yang ditetapkan.
71
+
72
+ - **Tanggal Pembuatan (createdAt)**: Menunjukkan tanggal dan waktu pembuatan dataset.
73
+
74
+ - **Tanggal Pembaruan Terakhir (updatedAt)**: Menunjukkan tanggal dan waktu pembaruan terakhir dataset.
75
+
76
+ - **Pencipta (creator)**: Menunjukkan pengguna yang menciptakan dataset.
77
+
78
+ - **Pengemaskini (updater)**: Menunjukkan pengguna yang terakhir mengemaskini dataset.
79
+
80
+ Tetapan dan maklumat ini membantu dalam mendefinisikan dataset dan menggunakan dataset, membolehkan pemahaman yang jelas mengenai tujuan dan penggunaan dataset.
81
+
82
+ ## Contoh Penggunaan Kunci Partisi (partitionKey)
83
+
84
+ **Contoh Penggunaan Kunci Partisi (Athena API):**
85
+
86
+ Athena adalah salah satu perkhidmatan pertanyaan Amazon Web Services (AWS), yang membolehkan pertanyaan dan analisis data yang disimpan di S3 dengan mudah. Mari kita lihat bagaimana menggunakan kunci partisi untuk mencari dan menapis data dengan cepat dalam Athena.
87
+
88
+ Anggapan:
89
+
90
+ - Dataset menyimpan data pesanan harian.
91
+ - Kunci partisi ditetapkan sebagai "Tanggal (Date)".
92
+
93
+ **Contoh Pertanyaan Athena:**
94
+
95
+ Berikut adalah contoh pertanyaan menggunakan Athena untuk mencari data pesanan pada tarikh tertentu.
96
+
97
+ ```sql
98
+ SELECT *
99
+ FROM "my_dataset"
100
+ WHERE "partition_key" = '2023-12-01';
101
+ ```
102
+
103
+ Pertanyaan ini mencari semua data pesanan dalam dataset "my_dataset" di mana kunci partisi "Tanggal" adalah '2023-12-01'. Penggunaan kunci partisi membolehkan pencarian data yang diinginkan dengan cepat walaupun dalam set data yang besar.
@@ -0,0 +1,103 @@
1
+ # 数据集 (DataSet)
2
+
3
+ 数据集通过各种设置和信息来定义。以下是关于数据集及其相关字段和设置选项的详细说明。
4
+
5
+ - **名称 (name)**:设置数据集的名称。该名称用于唯一标识数据集。
6
+
7
+ - **描述 (description)**:设置有关数据集的描述。用于说明数据集的目的、内容或特征。
8
+
9
+ - **类型 (type)**:设置数据集的类型。可以选择以下两个选项之一:
10
+
11
+ - **手动收集 (Manual)**:表示用户直接输入数据的数据集。
12
+ - **自动收集 (Automatic)**:表示通过自动化方法,如传感器,收集数据的数据集。
13
+
14
+ - **数据键集 (dataKeySet)**:在数据键集主页面注册的项目应用于数据集。数据键集定义了数据集中使用的数据字段和属性。
15
+
16
+ - **分区键 (partitionKeys)**:设置用于分割和组织数据的分区键。分区键逻辑上对数据进行分组和存储,并提高数据管理和检索的效率。通过使用分区键,可以快速过滤和查询数据。
17
+
18
+ - **计划 (schedule)**:设置数据输入周期。设置周期后,将根据该周期执行数据输入作业。
19
+
20
+ - **时区 (timezone)**:设置计划应用的基准时区。用于相关时间转换工作。
21
+
22
+ - **管理员角色 (supervisoryRole)**:设置数据集的管理员角色。管理员拥有数据集的权限和责任。
23
+
24
+ - **输入负责角色 (entryRole)**:设置拥有输入权限的角色。表示执行数据输入工作的角色。
25
+
26
+ - **输入用界面类型 (entryType)**:设置输入界面类型。可以选择以下选项之一:
27
+
28
+ - **Generated**: 自动使用实现的界面。
29
+ - **Board**: 使用 Board 界面。
30
+ - **Page**: 转到实现的页面。需要子 URL(suburl)。
31
+ - **External URL**: 转到外部页面。需要完整 URL。
32
+
33
+ - **输入用界面 (entryView)**:根据输入界面类型设置值。如果选择 Board 界面类型,则可以设置相应的值。
34
+
35
+ - **监控用界面类型 (monitorType)**:设置监控用界面类型。提供与输入界面类型相同的选项。
36
+
37
+ - **监控用界面 (monitorView)**:根据监控用界面类型设置值。
38
+
39
+ - **报告用界面类型 (reportType)**:设置报告用界面类型。部分共享输入界面类型的选项。
40
+
41
+ - **Jasper**: 根据 Jasper 服务器设置,渲染 Jasper 报告页面以生成报告。
42
+ - **Shiny**: 根据 Shiny 服务器设置,渲染 Shiny 应用程序页面以生成报告。
43
+
44
+ - **报告用界面 (reportView)**:根据报告用界面类型设置值。例如 Jasper 或 Shiny 的情况下,需要在相应服务器上有效的子 URL(suburl)。
45
+
46
+ - **报告用模板 (reportTemplate)**:上传报告用界面所需的模板文件。
47
+
48
+ - **指派者 (assignees)**:设置负责处理异常数据审批线的负责人。
49
+
50
+ - **审批线 (reviewApprovalLine)**:设置数据集审批线。
51
+
52
+ - **异常数据处理审批线 (outlierApprovalLine)**:设置异常数据处理的审批线。
53
+
54
+ - **使用案例 (useCase)**:表示数据集的用途或目的。包括 "QA"、"CCP"、"SPC" 等常见用例选项。
55
+
56
+ - **数据项 (dataItems)**:设置数据集的数据项。
57
+
58
+ - **数据输入计划 (schedule)**:设置数据输入周期。
59
+
60
+ - **数据输入时区 (timezone)**:设置数据集输入相关的时区。
61
+
62
+ - **审查需要性 (requiresReview)**:表示是否需要审查数据集。
63
+
64
+ - **计划 ID (scheduleId)**:设置数据集的计划 ID。
65
+
66
+ - **汇总周期 (summaryPeriod)**:设置汇总周期后,自动在调度器中注册汇总作业。目前,考虑到工作负载,不提供每周、每
67
+
68
+ 月周期的汇总。周期选项包括小时(hour)、班次(shift)、工作日(workdate)、每日(daily)。
69
+
70
+ - **下次汇总执行时间 (summarySchedule)**:根据设定的汇总周期,通知下次汇总执行时间。根据设定周期执行汇总作业。
71
+
72
+ - **创建日期 (createdAt)**:表示数据集创建的日期和时间。
73
+
74
+ - **最后更新日期 (updatedAt)**:表示数据集最后更新的日期和时间。
75
+
76
+ - **创建者 (creator)**:表示创建数据集的用户。
77
+
78
+ - **更新者 (updater)**:表示最后更新数据集的用户。
79
+
80
+ 这些设置和信息有助于定义数据集并使用数据集,帮助清晰理解数据集的目的和用途。
81
+
82
+ ## 分区键利用示例 (partitionKey)
83
+
84
+ **分区键利用示例 (Athena API):**
85
+
86
+ Athena 是 Amazon Web Services (AWS) 的一种查询服务,可以轻松查询和分析存储在 S3 上的数据。我们将看到在 Athena 中使用分区键快速检索和过滤数据的方法。
87
+
88
+ 假设:
89
+
90
+ - 数据集存储每日订单数据。
91
+ - 分区键设置为 "日期 (Date)"。
92
+
93
+ **Athena 查询示例:**
94
+
95
+ 以下是使用 Athena 查询特定日期订单数据的查询示例。
96
+
97
+ ```sql
98
+ SELECT *
99
+ FROM "my_dataset"
100
+ WHERE "partition_key" = '2023-12-01';
101
+ ```
102
+
103
+ 此查询搜索 "my_dataset" 数据集中 "日期" 分区键为 '2023-12-01' 的所有订单数据。利用分区键,即使在大型数据集中也可以快速找到所需数据。