Optimization for Digital Preservation Documents
Title:
Optimization for Digital Preservation Documents
Document Type:
Standard Operating Procedure
Security Classification:
Technology, Digital Preservation
Department:
NF Technology
Author (s):
Natkeeran
Sangeetha
Parathan
Approved By:
Year:
March 2020
Contents
நோக்கம் (Purpose of the Document)
நூலக நிறுவனத்தில் மின்வருடப்பட்ட ஒவ்வொரு தனிப்பட்ட PDF ஆவணங்களையும் மிகக் குறைந்தளவுகளை (குறைந்த MB Size) உடைய PDF ஆக மாற்றி அவற்றை குறைந்த நேரத்தில் இலகுவாக வலைத்தளத்தில் பதிவேற்றம் செய்யும் முகமாக நூலக நிறுவனத்தின் பணியோட்டத்திற்கு ஏற்ற வகையில் எழுதப்பட்ட தானியங்கி script ஆகும்.
பிரசனைகள் (Problems)
- PDF கோப்புக்கள் அதிக file size கொண்டிருந்தமையால் பின்வரும் பிரச்சினைகள் காணப்பட்டன:
- வலைத்தளத்தில் கோப்புக்களை பதிவேற்றுவதில் நேர விரயம்
- பயனர்கள் PDF கோப்புக்களை திறந்து பார்ப்பதில் load ஆக அதிக நேரம் எடுத்தமை
Script உருவாக்கத்தின் நன்மைகள் (Benefits)
- PDF கோப்புக்கள் file size குறைக்கப்பட்டதால் பின்வரும் நன்மைகளை பெற்றுக்கொள்ளக் கூடியதாய் அமைந்தது:
- வலைத்தளத்திற்கு பதிவேற்றலில் நேர சேமிப்பு
- பயனர்களுக்கு PDF கோப்புகள் load ஆவது முன்பை விடக் குறைவான நேர அளவாக இருந்தமை
Prerequisites
- Python2
- Ghostscript
குறிப்பு: Windows இயங்கு தளத்தில் செய்வதற்கு Ghostscript version கள் மற்றும் Python configuration கள் காணப்படுவதால் இந்த script ஐ Ubuntu ல் பயன்படுத்துவது சுலபம்.
Ghostscript ஐ Ubuntu ல் நிறுவுவதற்கு பின்வரும் command களை Terminal ல் run செய்ய வேண்டும்.
- sudo apt-get update -y
- sudo apt-get install -y ghostscript-x
- ghostscript --version (To check Ghostscript version)
Script ஐ கையாளும் முறை
Step 1:
செய்யப்பட வேண்டிய pdfs இணை Script உள்ள கோப்பில் பதித்தல்
Step 2:
script ஐ run செய்தல் ( Python2 என்பதால் python2 <file name> என run செய்தல் வேண்டும்)
References:
- Source Code on Github: link (need to do a PR)
- Video Explanation to install GhostScript: https://www.youtube.com/watch?v=BavL9rUPVDo&feature=emb_title