seperated out comic processing to processing.py.

2026-08-03 03:45:43 +00:00 · 2022-08-31 11:18:55 +01:00
parent 24b33be53c
commit dfbe4381a9
2 changed files with 134 additions and 126 deletions
@@ -0,0 +1,126 @@
 import mimetypes
 from itertools import chain
 from pathlib import Path
 from typing import NamedTuple, List
 from django.conf import settings
 from django.contrib.auth.models import User
 from django.db.models import Count, Q, F, Case, When, PositiveSmallIntegerField
 from comic import models
 from comic.errors import NotCompatibleArchive
 def generate_directory(user: User, directory=None):
    dir_path = Path(settings.COMIC_BOOK_VOLUME, directory.path) if directory else settings.COMIC_BOOK_VOLUME
    files = []
    dir_db_query = models.Directory.objects.filter(parent=directory)
    clean_directories(dir_db_query, dir_path, directory)
    file_db_query = models.ComicBook.objects.filter(directory=directory)
    clean_files(file_db_query, user, dir_path, directory)
    dir_db_query = dir_db_query.annotate(
        total=Count('comicbook', distinct=True),
        progress=Count('comicbook__comicstatus', Q(comicbook__comicstatus__finished=True,
                                                   comicbook__comicstatus__user=user), distinct=True),
        finished=Q(total=F('progress')),
        unread=Q(total__gt=F('progress'))
    )
    files.extend(dir_db_query)
    # Create Missing Status
    new_status = [models.ComicStatus(comic=file, user=user) for file in
                  file_db_query.exclude(comicstatus__in=models.ComicStatus.objects.filter(
                      comic__in=file_db_query, user=user))]
    models.ComicStatus.objects.bulk_create(new_status)
    file_db_query = file_db_query.annotate(
        total=Count('comicpage', distinct=True),
        progress=F('comicstatus__last_read_page') + 1,
        finished=F('comicstatus__finished'),
        unread=F('comicstatus__unread'),
        user=F('comicstatus__user'),
        classification=Case(
            When(directory__isnull=True, then=models.Directory.Classification.C_G),
            default=F('directory__classification'),
            output_field=PositiveSmallIntegerField(choices=models.Directory.Classification.choices)
        )
    ).filter(Q(user__isnull=True) | Q(user=user.id))
    files.extend(file_db_query)
    for file in chain(file_db_query, dir_db_query):
        if file.thumbnail and not Path(file.thumbnail.path).exists():
            file.thumbnail.delete()
            file.save()
    files.sort(key=lambda x: x.title)
    files.sort(key=lambda x: x.type, reverse=True)
    return files
 def clean_directories(directories, dir_path, directory=None):
    dir_db_set = set([Path(settings.COMIC_BOOK_VOLUME, x.path) for x in directories])
    dir_list = set([x for x in sorted(dir_path.glob('*')) if x.is_dir()])
    # Create new directories db instances
    for new_directory in dir_list - dir_db_set:
        models.Directory(name=new_directory.name, parent=directory).save()
    # Remove stale db instances
    for stale_directory in dir_db_set - dir_list:
        models.Directory.objects.get(name=stale_directory.name, parent=directory).delete()
 def clean_files(files, user, dir_path, directory=None):
    file_list = set([x for x in sorted(dir_path.glob('*')) if x.is_file()])
    files_db_set = set([Path(dir_path, x.file_name) for x in files])
    # Parse new comics
    books_to_add = []
    for new_comic in file_list - files_db_set:
        if new_comic.suffix.lower() in settings.SUPPORTED_FILES:
            books_to_add.append(
                models.ComicBook(file_name=new_comic.name, directory=directory)
            )
    models.ComicBook.objects.bulk_create(books_to_add)
    pages_to_add = []
    status_to_add = []
    for book in books_to_add:
        status_to_add.append(models.ComicStatus(user=user, comic=book))
        try:
            archive, archive_type = book.get_archive()
            if archive_type == 'archive':
                pages_to_add.extend([
                    models.ComicPage(
                        Comic=book, index=idx, page_file_name=page.file_name, content_type=page.mime_type
                    ) for idx, page in enumerate(get_archive_files(archive))
                ])
            elif archive_type == 'pdf':
                pages_to_add.extend([
                    models.ComicPage(
                        Comic=book, index=idx, page_file_name=idx + 1, content_type='application/pdf'
                    ) for idx in range(archive.page_count)
                ])
        except NotCompatibleArchive:
            pass
    models.ComicStatus.objects.bulk_create(status_to_add)
    models.ComicPage.objects.bulk_create(pages_to_add)
    # Remove stale comic instances
    for stale_comic in files_db_set - file_list:
        models.ComicBook.objects.get(file_name=stale_comic.name, directory=directory).delete()
 class ArchiveFile(NamedTuple):
    file_name: str
    mime_type: str
 def get_archive_files(archive) -> List[ArchiveFile]:
    return [
        ArchiveFile(x, mimetypes.guess_type(x)[0]) for x in sorted(archive.namelist())
        if not x.endswith('/') and mimetypes.guess_type(x)[0]
    ]
@@ -1,14 +1,12 @@
 import mimetypes
 from itertools import chain
 from pathlib import Path
-from typing import Union, NamedTuple, List
+from typing import Union
 from uuid import UUID
 from django.conf import settings
 from django.contrib.auth.models import User
 from django.contrib.auth.password_validation import validate_password
 from django.core.exceptions import ValidationError
-from django.db.models import Count, Case, When, F, PositiveSmallIntegerField, Q
+from django.db.models import Count, Case, When, F, PositiveSmallIntegerField
 from django.http import FileResponse
 from drf_yasg.utils import swagger_auto_schema
 from rest_framework import viewsets, serializers, mixins, permissions, status, renderers
@@ -19,7 +17,7 @@ from rest_framework.request import Request
 from rest_framework.response import Response
 from comic import models
-from comic.errors import NotCompatibleArchive
+from comic.processing import generate_directory
 from comic.util import generate_breadcrumbs_from_path
@@ -113,23 +111,19 @@ class BreadcrumbSerializer(serializers.Serializer):
    name = serializers.CharField()
 class ArchiveFile(NamedTuple):
    file_name: str
    mime_type: str
 class BrowseViewSet(viewsets.GenericViewSet):
    serializer_class = BrowseSerializer
    permission_classes = [permissions.IsAuthenticated]
    lookup_field = 'selector'
    def list(self, request):
-        serializer = self.get_serializer(self.generate_directory(request.user), many=True)
+        serializer = self.get_serializer(generate_directory(request.user), many=True)
        return Response(serializer.data)
    @swagger_auto_schema(responses={status.HTTP_200_OK: BrowseSerializer(many=True)})
    def retrieve(self, request, selector: UUID):
        directory = models.Directory.objects.get(selector=selector)
-        serializer = self.get_serializer(self.generate_directory(request.user, directory), many=True)
+        serializer = self.get_serializer(generate_directory(request.user, directory), many=True)
        return Response(serializer.data)
    @swagger_auto_schema(responses={status.HTTP_200_OK: BreadcrumbSerializer(many=True)})
@@ -152,120 +146,6 @@ class BrowseViewSet(viewsets.GenericViewSet):
        serializer = self.get_serializer(queryset, many=True)
        return Response(serializer.data)
    @staticmethod
    def clean_directories(directories, dir_path, directory=None):
        dir_db_set = set([Path(settings.COMIC_BOOK_VOLUME, x.path) for x in directories])
        dir_list = set([x for x in sorted(dir_path.glob('*')) if x.is_dir()])
        # Create new directories db instances
        for new_directory in dir_list - dir_db_set:
            models.Directory(name=new_directory.name, parent=directory).save()
        # Remove stale db instances
        for stale_directory in dir_db_set - dir_list:
            models.Directory.objects.get(name=stale_directory.name, parent=directory).delete()
    @staticmethod
    def get_archive_files(archive) -> List[ArchiveFile]:
        return [
            ArchiveFile(x, mimetypes.guess_type(x)[0]) for x in sorted(archive.namelist())
            if not x.endswith('/') and mimetypes.guess_type(x)[0]
        ]
    @staticmethod
    def clean_files(files, user, dir_path, directory=None):
        file_list = set([x for x in sorted(dir_path.glob('*')) if x.is_file()])
        files_db_set = set([Path(dir_path, x.file_name) for x in files])
        # Parse new comics
        books_to_add = []
        for new_comic in file_list - files_db_set:
            if new_comic.suffix.lower() in settings.SUPPORTED_FILES:
                books_to_add.append(
                    models.ComicBook(file_name=new_comic.name, directory=directory)
                )
        models.ComicBook.objects.bulk_create(books_to_add)
        pages_to_add = []
        status_to_add = []
        for book in books_to_add:
            status_to_add.append(models.ComicStatus(user=user, comic=book))
            try:
                archive, archive_type = book.get_archive()
                if archive_type == 'archive':
                    pages_to_add.extend([
                        models.ComicPage(
                            Comic=book, index=idx, page_file_name=page.file_name, content_type=page.mime_type
                        ) for idx, page in enumerate(BrowseViewSet.get_archive_files(archive))
                    ])
                elif archive_type == 'pdf':
                    pages_to_add.extend([
                        models.ComicPage(
                            Comic=book, index=idx, page_file_name=idx + 1, content_type='application/pdf'
                        ) for idx in range(archive.page_count)
                    ])
            except NotCompatibleArchive:
                pass
        models.ComicStatus.objects.bulk_create(status_to_add)
        models.ComicPage.objects.bulk_create(pages_to_add)
        # Remove stale comic instances
        for stale_comic in files_db_set - file_list:
            models.ComicBook.objects.get(file_name=stale_comic.name, directory=directory).delete()
    def generate_directory(self, user: User, directory=None):
        """
        :type user: User
        :type directory: Directory
        """
        dir_path = Path(settings.COMIC_BOOK_VOLUME, directory.path) if directory else settings.COMIC_BOOK_VOLUME
        files = []
        dir_db_query = models.Directory.objects.filter(parent=directory)
        self.clean_directories(dir_db_query, dir_path, directory)
        file_db_query = models.ComicBook.objects.filter(directory=directory)
        self.clean_files(file_db_query, user, dir_path, directory)
        dir_db_query = dir_db_query.annotate(
            total=Count('comicbook', distinct=True),
            progress=Count('comicbook__comicstatus', Q(comicbook__comicstatus__finished=True,
                                                       comicbook__comicstatus__user=user), distinct=True),
            finished=Q(total=F('progress')),
            unread=Q(total__gt=F('progress'))
        )
        files.extend(dir_db_query)
        # Create Missing Status
        new_status = [models.ComicStatus(comic=file, user=user) for file in
                      file_db_query.exclude(comicstatus__in=models.ComicStatus.objects.filter(
                          comic__in=file_db_query, user=user))]
        models.ComicStatus.objects.bulk_create(new_status)
        file_db_query = file_db_query.annotate(
            total=Count('comicpage', distinct=True),
            progress=F('comicstatus__last_read_page') + 1,
            finished=F('comicstatus__finished'),
            unread=F('comicstatus__unread'),
            user=F('comicstatus__user'),
            classification=Case(
                When(directory__isnull=True, then=models.Directory.Classification.C_G),
                default=F('directory__classification'),
                output_field=PositiveSmallIntegerField(choices=models.Directory.Classification.choices)
            )
        ).filter(Q(user__isnull=True) | Q(user=user.id))
        files.extend(file_db_query)
        for file in chain(file_db_query, dir_db_query):
            if file.thumbnail and not Path(file.thumbnail.path).exists():
                file.thumbnail.delete()
                file.save()
        files.sort(key=lambda x: x.title)
        files.sort(key=lambda x: x.type, reverse=True)
        return files
 class GenerateThumbnailSerializer(serializers.Serializer):
    selector = serializers.UUIDField()
@@ -277,6 +157,7 @@ class GenerateThumbnailViewSet(viewsets.ViewSet):
    serializer_class = GenerateThumbnailSerializer
    lookup_field = 'selector'
    @swagger_auto_schema(responses={status.HTTP_200_OK: GenerateThumbnailSerializer()})
    def retrieve(self, _request, selector: UUID):
        try:
            directory = models.Directory.objects.get(selector=selector)
@@ -419,6 +300,7 @@ class ImageViewSet(viewsets.ViewSet):
    lookup_field = 'page'
    renderer_classes = [PassthroughRenderer]
    @swagger_auto_schema(responses={status.HTTP_200_OK: "A Binary Image response"})
    def retrieve(self, _request, parent_lookup_selector, page):
        book = models.ComicBook.objects.get(selector=parent_lookup_selector)
        img, content = book.get_image(int(page))