# [メタ情報] # 識別子: DAS棚田管理メタデータDB仕様書_exe # システム名: DDAS棚田管理メタデータDB仕様書 # 技術種別: Misc # 機能名: Misc # 使用言語: # 状態: 実行用 # [/メタ情報] DAS棚田管理 メタデータDB仕様書(基礎仕様) ======================================== 目的 ---- 本DBは、実データを一切移動させることなく、 DAS/SSD/NAS 等に存在する全ファイルの「棚卸し伝票(メタデータ)」を 網羅的に記録するためのものである。 本DBは「判断・シミュレーション・承認」のための基盤であり、 移動処理そのものは別工程で行う。 基本思想(棚田管理の原則) -------------------------- 1. 網羅性を最優先とする - 構内(対象パス配下)に存在する全ファイルには必ず伝票が貼られる - 処理IDや転出判断より先に、全点棚卸しを行う 2. 本データは動かさない - DB生成時・シミュレーション時に実体ファイルは一切移動しない 3. メタデータで判断し、確定後にのみ実体を動かす - 順位付け・分類・転出可否はすべてDB上で行う DB生成対象範囲(網羅性の定義) ------------------------------ DBの初期生成対象は、設定シート(tanadaシート)D列に 記述された「転出パス」すべての配下である。 ・D列は 1行1パス ・必ずフルパスで記述する ・/ から始まり、フォルダ名で終わる ・末尾に / は付けない 例: /Volumes/NO3_SSD/Dropbox/カメラアップロード /Volumes/NO3_SSD/Dropbox/dropbox_1 /Volumes/T1_main /Volumes/T2_main これらすべてを合算した範囲が「棚卸し対象世界」である。 転出除外パスの扱い ------------------ E列(転出除外パス)は、DB生成時には使用しない。 ・網羅DBは除外なしで生成する ・転出除外の判断は、処理ID単位のシミュレーション段階で行う 理由: 網羅性を欠かさず、後から条件を変えて再評価できるようにするため。 DBに記録する基本メタデータ項目(棚卸し伝票) ---------------------------------------------- 各ファイルについて、最低限以下を記録する。 ・abs_path - フルパス(例:/Volumes/NO3_SSD/Dropbox/xxx/yyy.jpg) ・root_path - D列で指定された起点パス - どの転出パス配下として検出されたかを示す ・rel_path - root_path からの相対パス - 転出・転入時にフォルダ構造を保持するために使用 ・filename - ファイル名のみ ・size_bytes - ファイルサイズ(バイト) ・mtime - 更新日時(UNIX time) ・mtime_iso - 更新日時(ISO8601文字列) ・scan_time - 棚卸し実行日時 処理ID(T0001 等)との関係 -------------------------- 処理IDは「棚卸し対象そのもの」ではない。 ・処理IDは、網羅DBの上に載る“評価・抽出・シミュレーション単位” ・同一処理ID内では: - 転出パスは複数可 - 転入パスは必ず1つ 例: T0001: 転出パス: /Volumes/NO3_SSD/Dropbox /Volumes/NO3_SSD/GoogleDrive 転入パス: /Volumes/T1_main/archives/cloud_archive パス保持ルール(重要) ---------------------- 転出時は、元のフォルダ構造を保持したまま移動する。 例: 転出元: /Volumes/NO3_SSD/Dropbox/カメラアップロード/2011/xxx.jpg 転入先: /Volumes/T1_main/archives/Dropbox_archive/カメラアップロード/2011/xxx.jpg rel_path はこの構造保持のために必須である。 DBの役割まとめ -------------- このDBは以下を目的とする。 ・現時点で「何が」「どこに」「どれだけ」存在するかを可視化する ・転出順位・容量超過・分類ルールを安全に試行できる ・承認後の移動作業を機械的・再現可能にする DBは「棚卸し伝票の控え」であり、判断の根拠そのものである。