Bagit Checksum for Digital Preservation
Title:
Bagit Checksum for Digital Preservation
Document Type:
Standard Operating Procedure
Security Classification:
Technology, Digital Preservation
Department:
NF Technology
Author (s):
Natkeeran
Parathan
Approved By:
Version:
Version 1.0: March 2020
Contents
நோக்கம் (Purpose of the Document)
நூலக நிறுவனத்தில் மின்வருடப்பட்டு காப்புப்படிக்குத் தயார் நிலையில் உள்ள ஆவணகங்களுக்கு நீண்ட கால உத்தரவாதத்தை அளிக்கும் முகமாக Library Of Congress ஆல் உருவாக்கப்பட்ட Bagit மென்பொருளைப் பயன்படுத்தி நூலக நிறுவனத்தின் பணியோட்டத்திற்கு ஏற்றவகையில் எழுதப்பட்ட தானியங்கி script இதுவாகும்.
Audience: இந்த script, Digital Preservation ல் பங்குவகிப்போருக்கும் நூலக ஆவணகக் காப்புப்படிகள் தொடர்பான செயற்பாடுகளில் ஈடுபடுவோருக்கு பயனுள்ளதாக அமையும்.
Prerequisites
- Python 3
- Bagit
- Pandas
Script ஐ கையாளும் முறை
இவ் script கள் 3 பிரிவுகளாகப் பிரிக்கப்பட்டுள்ளது:
- Bagit ஐ பயன்படுத்தி காப்புப்படி எடுக்கப்பட்ட கோப்புகளுக்கு checksum எண்ணிக்கையை பெற்றுக்கொள்ள வேண்டும்
- Bagit மூலம் உருவாக்கப்பட்ட கோப்புகளையும், ஆவணங்களையும் Zip கோப்புகளாக மாற்றி வன்தட்டுகளில் காப்புப்படிகள் எடுக்க வேண்டும்.
- மூன்றாவது script எமக்குத் தேவையான நேரங்களில் காப்புப்படி எடுக்கப்பட்ட கோப்புக்களின் தரத்தினை (அழிவடைந்துள்ளதா இல்லையா என) அறிந்து கொள்ள உருவாக்கப்பட்டுள்ளது. இறுதியில் ஒவ்வொரு ஆவணக்கங்களும் எவ்வாறு உள்ளன என்பதை CSV கோப்பில் தரம் சரிபார்க்கப்பட்ட திகதியுடன் தரும்.
Script ஐ கையாளும் முறை
Step 1:
Bag செய்யும் script ஐ run செய்தல்.
Step 2:
Zip செய்யும் script ஐ run செய்தல்
Step 3 [Optional]:
தேவையான நேரங்களில் ஆவணங்களின் தன்மையை validate செய்ய validation script ஐ run செய்யலாம்.
Reference
- Source Code in NF Github
- Github Link: https://github.com/LibraryOfCongress/bagit-python
- Bagit தொடர்பான அறிமுக காணொளி: https://www.youtube.com/watch?v=l3p3ao_JSfo