audiobookshelf/server/utils/parsers/parseComicMetadata.js

const Path = require('path')
const globals = require('../globals')
const fs = require('../../libs/fsExtra')
const Logger = require('../../Logger')
const Archive = require('../../libs/libarchive/archive')
const { xmlToJSON } = require('../index')
const parseComicInfoMetadata = require('./parseComicInfoMetadata')

/**
 *
 * @param {string} filepath
 * @returns {Promise<Buffer>}
 */
async function getComicFileBuffer(filepath) {
  if (!(await fs.pathExists(filepath))) {
    Logger.error(`Comic path does not exist "${filepath}"`)
    return null
  }
  try {
    return fs.readFile(filepath)
  } catch (error) {
    Logger.error(`Failed to read comic at "${filepath}"`, error)
    return null
  }
}

/**
 * Extract cover image from comic return true if success
 *
 * @param {string} comicPath
 * @param {string} comicImageFilepath
 * @param {string} outputCoverPath
 * @returns {Promise<boolean>}
 */
async function extractCoverImage(comicPath, comicImageFilepath, outputCoverPath) {
  const comicFileBuffer = await getComicFileBuffer(comicPath)
  if (!comicFileBuffer) return null

  const archive = await Archive.open(comicFileBuffer)
  const fileEntry = await archive.extractSingleFile(comicImageFilepath)

  if (!fileEntry?.fileData) {
    Logger.error(`[parseComicMetadata] Invalid file entry data for comicPath "${comicPath}"/${comicImageFilepath}`)
    return false
  }

  try {
    await fs.writeFile(outputCoverPath, fileEntry.fileData)
    return true
  } catch (error) {
    Logger.error(`[parseComicMetadata] Failed to extract image from comicPath "${comicPath}"`, error)
    return false
  } finally {
    // Ensure we free the memory
    archive.close()
  }
}
module.exports.extractCoverImage = extractCoverImage

/**
 * Parse metadata from comic
 *
 * @param {import('../../models/Book').EBookFileObject} ebookFile
 * @returns {Promise<import('./parseEbookMetadata').EBookFileScanData>}
 */
async function parse(ebookFile) {
  const comicPath = ebookFile.metadata.path
  Logger.debug(`Parsing metadata from comic at "${comicPath}"`)

  const comicFileBuffer = await getComicFileBuffer(comicPath)
  if (!comicFileBuffer) return null

  const archive = await Archive.open(comicFileBuffer)

  const fileObjects = await archive.getFilesArray()

  fileObjects.sort((a, b) => {
    return a.file.name.localeCompare(b.file.name, undefined, {
      numeric: true,
      sensitivity: 'base'
    })
  })

  let metadata = null
  const comicInfo = fileObjects.find((fo) => fo.file.name === 'ComicInfo.xml')
  if (comicInfo) {
    const comicInfoEntry = await comicInfo.file.extract()
    if (comicInfoEntry?.fileData) {
      const comicInfoStr = new TextDecoder().decode(comicInfoEntry.fileData)
      const comicInfoJson = await xmlToJSON(comicInfoStr)
      if (comicInfoJson) {
        metadata = parseComicInfoMetadata.parse(comicInfoJson)
      }
    }
  }

  const payload = {
    path: comicPath,
    ebookFormat: ebookFile.ebookFormat,
    metadata
  }

  const firstImage = fileObjects.find((fo) => globals.SupportedImageTypes.includes(Path.extname(fo.file.name).toLowerCase().slice(1)))
  if (firstImage?.file?._path) {
    payload.ebookCoverPath = firstImage.file._path
  } else {
    Logger.warn(`Cover image not found in comic at "${comicPath}"`)
  }

  // Ensure we close the archive to free memory
  archive.close()

  return payload
}
module.exports.parse = parse
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`const Path = require('path')`
			`const globals = require('../globals')`
			`const fs = require('../../libs/fsExtra')`
			`const Logger = require('../../Logger')`
			`const Archive = require('../../libs/libarchive/archive')`
			`const { xmlToJSON } = require('../index')`
			`const parseComicInfoMetadata = require('./parseComicInfoMetadata')`

			`/**`
Autoformat `parseComicMetadata` 2024-08-20 06:00:16 +02:00			`*`
			`* @param {string} filepath`
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`* @returns {Promise<Buffer>}`
			`*/`
			`async function getComicFileBuffer(filepath) {`
Autoformat `parseComicMetadata` 2024-08-20 06:00:16 +02:00			`if (!(await fs.pathExists(filepath))) {`
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			Logger.error(`Comic path does not exist "${filepath}"`)
			`return null`
			`}`
			`try {`
			`return fs.readFile(filepath)`
			`} catch (error) {`
			Logger.error(`Failed to read comic at "${filepath}"`, error)
			`return null`
			`}`
			`}`

			`/**`
			`* Extract cover image from comic return true if success`
Autoformat `parseComicMetadata` 2024-08-20 06:00:16 +02:00			`*`
			`* @param {string} comicPath`
			`* @param {string} comicImageFilepath`
			`* @param {string} outputCoverPath`
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`* @returns {Promise<boolean>}`
			`*/`
			`async function extractCoverImage(comicPath, comicImageFilepath, outputCoverPath) {`
			`const comicFileBuffer = await getComicFileBuffer(comicPath)`
			`if (!comicFileBuffer) return null`

			`const archive = await Archive.open(comicFileBuffer)`
			`const fileEntry = await archive.extractSingleFile(comicImageFilepath)`

			`if (!fileEntry?.fileData) {`
			Logger.error(`[parseComicMetadata] Invalid file entry data for comicPath "${comicPath}"/${comicImageFilepath}`)
			`return false`
			`}`

			`try {`
			`await fs.writeFile(outputCoverPath, fileEntry.fileData)`
			`return true`
			`} catch (error) {`
			Logger.error(`[parseComicMetadata] Failed to extract image from comicPath "${comicPath}"`, error)
			`return false`
Free memory after extracting comic 2024-08-20 07:05:25 +02:00			`} finally {`
			`// Ensure we free the memory`
			`archive.close()`
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`}`
			`}`
			`module.exports.extractCoverImage = extractCoverImage`

			`/**`
			`* Parse metadata from comic`
Autoformat `parseComicMetadata` 2024-08-20 06:00:16 +02:00			`*`
			`* @param {import('../../models/Book').EBookFileObject} ebookFile`
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`* @returns {Promise<import('./parseEbookMetadata').EBookFileScanData>}`
			`*/`
			`async function parse(ebookFile) {`
			`const comicPath = ebookFile.metadata.path`
			Logger.debug(`Parsing metadata from comic at "${comicPath}"`)

			`const comicFileBuffer = await getComicFileBuffer(comicPath)`
			`if (!comicFileBuffer) return null`

			`const archive = await Archive.open(comicFileBuffer)`

			`const fileObjects = await archive.getFilesArray()`

			`fileObjects.sort((a, b) => {`
			`return a.file.name.localeCompare(b.file.name, undefined, {`
			`numeric: true,`
			`sensitivity: 'base'`
			`})`
			`})`

			`let metadata = null`
Autoformat `parseComicMetadata` 2024-08-20 06:00:16 +02:00			`const comicInfo = fileObjects.find((fo) => fo.file.name === 'ComicInfo.xml')`
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`if (comicInfo) {`
			`const comicInfoEntry = await comicInfo.file.extract()`
			`if (comicInfoEntry?.fileData) {`
			`const comicInfoStr = new TextDecoder().decode(comicInfoEntry.fileData)`
			`const comicInfoJson = await xmlToJSON(comicInfoStr)`
			`if (comicInfoJson) {`
			`metadata = parseComicInfoMetadata.parse(comicInfoJson)`
			`}`
			`}`
			`}`

			`const payload = {`
			`path: comicPath,`
			`ebookFormat: ebookFile.ebookFormat,`
			`metadata`
			`}`

Autoformat `parseComicMetadata` 2024-08-20 06:00:16 +02:00			`const firstImage = fileObjects.find((fo) => globals.SupportedImageTypes.includes(Path.extname(fo.file.name).toLowerCase().slice(1)))`
Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`if (firstImage?.file?._path) {`
			`payload.ebookCoverPath = firstImage.file._path`
			`} else {`
			Logger.warn(`Cover image not found in comic at "${comicPath}"`)
			`}`

Free memory after extracting comic 2024-08-20 07:05:25 +02:00			`// Ensure we close the archive to free memory`
			`archive.close()`

Add:Scanner extracts cover from comic files #1837 and ComicInfo.xml parser 2024-01-15 00:51:26 +01:00			`return payload`
			`}`
Autoformat `parseComicMetadata` 2024-08-20 06:00:16 +02:00			`module.exports.parse = parse`