StirlingPDF: Manipulación avanzada de archivos PDF

StirlingPDF es una herramienta en contenedor para convertir, editar o aplicar OCR a documentos PDF. Funciona bien en local, con interfaz sencilla y muchas opciones.

.env

DOCKER_ENABLE_SECURITY=false
INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
LANGS=es_ES

docker-compose.yml

docker-compose.yml

services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    container_name: S-PDF
    restart: unless-stopped
    network_mode: bridge
    ports:
      - '9080:8080'
    volumes:
      - ./trainingData:/usr/share/tessdata
      - ./extraConfigs:/configs
      - ./customFiles:/customFiles/
      - ./logs:/logs/
    environment:
      - DOCKER_ENABLE_SECURITY=${DOCKER_ENABLE_SECURITY}
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=${INSTALL_BOOK_AND_ADVANCED_HTML_OPS}
      - LANGS=${LANGS}

Detalles clave

Puerto 9080: interfaz web accesible desde el navegador.
Volúmenes:
- trainingData: datos adicionales de idioma para OCR.
- logs: registros internos.
- customFiles: carpeta para insertar archivos propios o logos.
- extraConfigs: configuraciones extendidas (opcional).
Variables:
- LANGS: puede incluir varios idiomas separados por comas.
- DOCKER_ENABLE_SECURITY: si está en false, no se activa la capa extra de seguridad.
- INSTALL_BOOK_AND_ADVANCED_HTML_OPS: activa funciones adicionales si se quiere editar HTML embebido o libros digitales.

Acceso y uso

Preparar .env con tus valores.
Levantar contenedor:
```
docker-compose up -d
```
Acceder desde navegador:
```
http://<IP-del-servidor>:9080
```
Usar interfaz para cargar PDFs, convertir, extraer texto, aplicar OCR, etc.

Notas personales

Lo uso principalmente para OCR de documentos escaneados.
El soporte para español es bueno, pero requiere el tessdata correspondiente en trainingData.
Algunas herramientas avanzadas están desactivadas por defecto, pero no hacen falta para tareas comunes.
Si se expone a internet, se recomienda protegerlo con Authentik o alguna capa de autenticación equivalente.

FileBrowser Quantum: Evolución de FileBrowser con más funciones

FileBrowser: Explorador de archivos accesible desde el navegador

Nextcloud (LinuxServer): Plataforma de almacenamiento y colaboración en la nube autohospedada

Nextcloud: Nube privada autohospedada con imagen oficial, MariaDB y Redis

Syncthing: Sincronización avanzada de archivos

TelDrive: Almacenamiento sobre Telegram

Gitea: Plataforma de gestión de repositorios Git autohospedada

Jenkins: Automatización de procesos de desarrollo y despliegue continuo

JupyterLab: Análisis y experimentación con Python

n8n: Automatización de flujos de trabajo

SonarQube: Análisis de la calidad del código

xyOps: Plataforma de automatización distribuida

Chibisafe: Compartir imágenes de forma rápida y privada

Palmr: Compartición de archivos simple y segura

ProjectSend: Compartir archivos de forma simple y controlada

Headscale + Headplane (GUI): Tu propio servidor Tailscale autohospedado

NetBird: Implementación de una VPN de malla basada en WireGuard y confianza cero (Parte I)

NetBird: Implementación de una VPN de malla basada en WireGuard y confianza cero (Parte II)

WGPortal: Panel moderno para gestionar WireGuard

Amule: Cliente P2P para intercambio de archivos en la red eDonkey y Kad

aMuTorrent: Gestor unificado de clientes P2P

JDownloader2: Gestor de descargas avanzado con soporte para múltiples plataformas

MeTube: Descarga de vídeos desde múltiples plataformas en línea

Nicotine: Acceso gráfico a la red Soulseek desde Linux

qBittorrent: Cliente de torrents eficiente y personalizable

Soulseek: Intercambio de música y archivos P2P

Doku: Monitorización de espacio en Docker

Dozzle: Visualización de logs en Docker

WUD (What's Up Docker): Monitorizar y recibir notificaciones sobre actualizaciones de contenedores

BentoPDF: Toolkit PDF autohospedado y orientado a privacidad

Bookstack: Wiki sencilla y flexible para gestionar documentación

PaperlessNGX: Gestión y digitalización de documentos o recibos

StirlingPDF: Manipulación avanzada de archivos PDF

Code Server: Editor de código basado en Visual Studio Code accesible desde cualquier navegador

CyberChef: Herramienta versátil para procesamiento de datos y criptografía

Draw.io: Editor de diagramas

Homepage: Dashboard personalizable para centralizar accesos rápidos a servicios

IT Tools: Colección de herramientas prácticas para redes e informática

LibreTranslate: API de traducción de texto autohospedada y sin dependencia de terceros

Linkwarden: Gestor de marcadores autohospedado para almacenar y organizar enlaces

Pingvin Share: comparte archivos de forma sencilla y autohospedada

SearxNG: privacidad, control y velocidad

WebCheck: Análisis OSINT de sitios web

OpenWebUI: Interfaz web para IA, similar a ChatGPT

BookLore: Gestión self-hosted de bibliotecas digitales similar a Calibre

Calibre: Gestión, conversión y lectura de libros electrónicos

Dispatcharr: Gestión y proxy de IPTV self-hosted

Immich: Almacenamiento y organización de fotos y vídeos con sincronización automática

Jellyfin: Servidor multimedia para películas, series y música

Komga: Servidor para lectura de cómics y mangas

Navidrome: Servidor de música autohospedado

Shoko Server: Organización avanzada de bibliotecas de anime

FreshRSS: Lector de feeds RSS para consolidar y leer noticias fácilmente

Jellystat: Estadísticas avanzadas para Jellyfin

Joplin: Sincronización autohospedada de notas

Radicale: Servidor de calendario, notas y contactos autohospedado

Adguard Home: Bloqueo de anuncios y rastreadores a nivel de red

Authentik: Plataforma de autenticación y autorización centralizada

Bitwarden (Vaultwarden): Despliegue y configuración del panel de administración

CrowdSec Web UI: Gestión gráfica de CrowdSec

NetAlertX: Monitorización y detección de dispositivos en red

nTopNG: Monitorización avanzada de tráfico de red

PassBolt: Gestor de contraseñas seguro y autoalojado

SocketProxy: Acceso controlado al daemon de Docker

Wazuh: Sistema de detección de intrusos (HIDS)

Beszel: Monitorización ligera centralizada

Grafana: Visualización y monitoreo de datos para métricas en tiempo real

Netdata: Monitorización de rendimiento en tiempo real

Checkmate: Plataforma local para vigilar infraestructura y servicios

CrocRelay: Infraestructura mínima para transferencias seguras

Gatus: Monitorización avanzada y flexible de servicios

PeaNUT: Interfaz web para Network UPS Tools (NUT)

phpMyAdmin: Administración web de MySQL y MariaDB

RustDesk: Escritorio remoto autohospedado

Scrutiny: Monitorización S.M.A.R.T. de discos

Speedtest Tracker: Monitoriza el rendimiento de tu conexión

Uptime Kuma: Monitorización en tiempo real del estado de tus servicios

Watchtower: Actualización automática de contenedores

StirlingPDF: Manipulación avanzada de archivos PDF

.env