Difference between revisions of "Aavanaham Backup Process"
Jump to navigation
Jump to search
Line 1: | Line 1: | ||
− | ஆவணகம் காப்புப்படி எடுக்கும் செயன்முறை | + | ===ஆவணகம் காப்புப்படி எடுக்கும் செயன்முறை=== |
− | + | அண்மையில் அல்லது இதுவரை காலமும் தரவேற்றப்பட்ட ஆவணக பதிவுகளின் மீதரவுத் தாளினை பெற வேண்டும் என்றால் கீழ் வரும் செயன்முறையை மேற்கொண்டு பெற முடியும். | |
− | அண்மையில் அல்லது இதுவரை காலமும் தரவேற்றப்பட்ட ஆவணக பதிவுகளின் மீதரவுத் தாளினை பெற வேண்டும். | ||
இது போன்ற உதாரணம் (https://docs.google.com/spreadsheets/d/1ZLl2LVl87rKwENuLim95HX67dDWRTHtAOD3FU14bS2Y/edit?usp=sharing) | இது போன்ற உதாரணம் (https://docs.google.com/spreadsheets/d/1ZLl2LVl87rKwENuLim95HX67dDWRTHtAOD3FU14bS2Y/edit?usp=sharing) | ||
− | பின்னர் அத் தரவுத்தாளில் உள்ள collection என முடிகின்ற row களை நீக்க வேண்டும். (காரணம்: collection களுக்குள் உள்ள | + | பின்னர் அத் தரவுத்தாளில் உள்ள collection என முடிகின்ற row களை நீக்க வேண்டும். (காரணம்: collection களுக்குள் உள்ள objects களை மாத்திரமே நாம் தரவிறக்கி காப்புப்படி எடுக்க வேண்டும். எனவே collection களை நீக்க வேண்டும். ). Islandora வினுடைய கட்டமைப்பில் ஒவ்வொரு Collections களுக்குள்ளும் Objects இருக்கும் |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | அது Server ல் /home/bags என்ற கோப்பினுள் Bag செய்யப்பட்டு Folder களாக சேமிக்கப்பட்டிருக்கும். பின்னர் /home/bags ல் உள்ள Folder களை ZIP கோப்புகளாக மாற்ற வேண்டும். அதற்கும் ஒரு Python script உள்ளது. அவ் Script ஐ /home/bags க்குள் | + | *Server ல் இடப்பற்றாக்குறை காரணமாக ஒரு நேரத்தில் 250 வரையான ஆவணகங்களை காப்புப்படி எடுத்தல் சிறந்த முறையாகும். எனவே CSV கோப்பினை சிறு சிறு பகுதிகளாக உருவாக்க வேண்டும். இதற்கு பைத்தான் மொழியில் எழுதப்பட்ட நிரலாக்கம் உள்ளது. அதனை run செய்வதன் மூலம் சிறு சிறு CSV கோப்புகளாக பெரிய CSV கோப்பிலிருந்து மாற்ற முடியும். |
+ | **பின்னர் சிறிதாக்கப்பட்ட CSV கோப்புகளை [https://haydenjames.io/linux-securely-copy-files-using-scp/ scp] ஐ பயன்படுத்தி ஆவணகம் server ல் பிரதி (copy) செய்தல் வேண்டும். | ||
+ | * பின்னர் server ல் '''/var/www/html''' folder உள் உள்ள '''[https://github.com/noolahamfoundation/digitization-pipeline/blob/master/aavanaham_automations/bagit.py bagit.py]''' என்ற பைத்தான் script ல் சிறிதாக்கப்பட்ட CSV கோப்பின் serverல் உள்ள path ஐ சரியாக கொடுத்து அவ் script ஐ run செய்ய வேண்டும். | ||
+ | ** அது Server ல் '''/home/bags''' என்ற கோப்பினுள் Bag செய்யப்பட்டு Folder களாக சேமிக்கப்பட்டிருக்கும். | ||
+ | * பின்னர் '''/home/bags''' ல் உள்ள Folder களை ZIP கோப்புகளாக மாற்ற வேண்டும். அதற்கும் ஒரு [https://github.com/noolahamfoundation/digitization-pipeline/blob/master/aavanaham_automations/zipBagsFoldersinAavanaham.py Python script] உள்ளது. அவ் Script ஐ '''/home/bags''' folder க்குள் copy செய்து run செய்ய வேண்டும். | ||
அந்த bags folder க்குள் ZIP கோப்புகள் உருவாக்கப்பட்டிருப்பதை காணமுடியும். | அந்த bags folder க்குள் ZIP கோப்புகள் உருவாக்கப்பட்டிருப்பதை காணமுடியும். | ||
[[Category:Technology]] | [[Category:Technology]] |
Revision as of 06:20, 12 January 2021
ஆவணகம் காப்புப்படி எடுக்கும் செயன்முறை
அண்மையில் அல்லது இதுவரை காலமும் தரவேற்றப்பட்ட ஆவணக பதிவுகளின் மீதரவுத் தாளினை பெற வேண்டும் என்றால் கீழ் வரும் செயன்முறையை மேற்கொண்டு பெற முடியும்.
இது போன்ற உதாரணம் (https://docs.google.com/spreadsheets/d/1ZLl2LVl87rKwENuLim95HX67dDWRTHtAOD3FU14bS2Y/edit?usp=sharing)
பின்னர் அத் தரவுத்தாளில் உள்ள collection என முடிகின்ற row களை நீக்க வேண்டும். (காரணம்: collection களுக்குள் உள்ள objects களை மாத்திரமே நாம் தரவிறக்கி காப்புப்படி எடுக்க வேண்டும். எனவே collection களை நீக்க வேண்டும். ). Islandora வினுடைய கட்டமைப்பில் ஒவ்வொரு Collections களுக்குள்ளும் Objects இருக்கும்
- Server ல் இடப்பற்றாக்குறை காரணமாக ஒரு நேரத்தில் 250 வரையான ஆவணகங்களை காப்புப்படி எடுத்தல் சிறந்த முறையாகும். எனவே CSV கோப்பினை சிறு சிறு பகுதிகளாக உருவாக்க வேண்டும். இதற்கு பைத்தான் மொழியில் எழுதப்பட்ட நிரலாக்கம் உள்ளது. அதனை run செய்வதன் மூலம் சிறு சிறு CSV கோப்புகளாக பெரிய CSV கோப்பிலிருந்து மாற்ற முடியும்.
- பின்னர் சிறிதாக்கப்பட்ட CSV கோப்புகளை scp ஐ பயன்படுத்தி ஆவணகம் server ல் பிரதி (copy) செய்தல் வேண்டும்.
- பின்னர் server ல் /var/www/html folder உள் உள்ள bagit.py என்ற பைத்தான் script ல் சிறிதாக்கப்பட்ட CSV கோப்பின் serverல் உள்ள path ஐ சரியாக கொடுத்து அவ் script ஐ run செய்ய வேண்டும்.
- அது Server ல் /home/bags என்ற கோப்பினுள் Bag செய்யப்பட்டு Folder களாக சேமிக்கப்பட்டிருக்கும்.
- பின்னர் /home/bags ல் உள்ள Folder களை ZIP கோப்புகளாக மாற்ற வேண்டும். அதற்கும் ஒரு Python script உள்ளது. அவ் Script ஐ /home/bags folder க்குள் copy செய்து run செய்ய வேண்டும்.
அந்த bags folder க்குள் ZIP கோப்புகள் உருவாக்கப்பட்டிருப்பதை காணமுடியும்.