Δυναμική προσαρμογή υπολογιστικής ισχύος
Το Chloros 1.1.0 εισάγει έξυπνη ανίχνευση υλικού και αυτόματη επιλογή στρατηγικής επεξεργασίας. Ο μηχανισμός επεξεργασίας προσαρμόζεται στο υλικό σας — από ένα Jetson Nano έως έναν σταθμό εργασίας με πολλαπλές GPU — χωρίς καμία χειροκίνητη ρύθμιση.
Πώς λειτουργεί
Όταν ξεκινά το Chloros, δημιουργεί αυτόματα προφίλ του συστήματός σας:
Ανιχνεύει το λειτουργικό σύστημα — Windows ή Linux
Προσδιορίζει τους πυρήνες της CPU και τη συνολική μνήμη RAM
3.Ανιχνεύει την παρουσία GPU — δυνατότητα NVIDIA CUDA, VRAM, μοντέλο 4. Προσδιορίζει το μοντέλο Jetson (εάν ισχύει) — μέσω του /proc/device-tree/model 5. Ελέγχει τους θερμικούς αισθητήρες (Jetson) — για επεξεργασία με γνώμονα τη θερμοκρασία 6. Επιλέγει τη βέλτιστη στρατηγική υπολογισμού — με βάση όλο το ανιχνευμένο υλικό 7. Διαμορφώνει τον αριθμό των εργαζομένων, τον τύπο του αγωγού και την κατανομή μνήμης αυτόματα
Το αποτέλεσμα αποθηκεύεται στην προσωρινή μνήμη, ώστε οι επόμενες εκτελέσεις να ξεκινούν γρηγορότερα. Εάν το υλικό αλλάξει (π.χ., προστεθεί μια GPU), το Chloros δημιουργεί εκ νέου προφίλ κατά την επόμενη εκκίνηση.
Στρατηγικές υπολογισμού
Το Chloros επιλέγει μία από τρεις στρατηγικές υπολογισμού με βάση το υλικό σας:
GPU_PARALLEL
Ναι (12 GB+ VRAM ή 16 GB+ κοινόχρηστη)
3-4
fused_gpu
GPU επιτραπέζιων υπολογιστών με 12 GB+, Jetson Orin NX 16 GB, AGX Orin
GPU_SINGLE
Ναι (< 12 GB VRAM)
1-3
tiled_gpu
GPU εισόδου, Jetson Nano, Orin Nano
CPU_PARALLEL
Όχι
πυρήνες - 1
cpu_fallback
Συστήματα χωρίς GPU NVIDIA
Τύποι αγωγών
fused_gpu— Πλήρης διαδρομή επεξεργασίας GPU. Όλες οι λειτουργίες debayer, διόρθωσης και ευρετηρίου εκτελούνται στην GPU σε ένα ενιαίο συνδυασμένο πέρασμα. Υψηλότερη απόδοση, αλλά απαιτεί περισσότερη VRAM.tiled_gpu— Διαδρομή GPU με αποδοτική χρήση μνήμης. Επεξεργάζεται εικόνες σε τμήματα ώστε να χωράνε στην περιορισμένη μνήμη της GPU. Χαμηλότερη απόδοση, αλλά λειτουργεί σε συσκευές με περιορισμούς μνήμης.cpu_fallback— Επεξεργασία μόνο με CPU χρησιμοποιώντας πολυνηματικό παραλληλισμό. Χρησιμοποιείται όταν δεν είναι διαθέσιμη GPU NVIDIA.***
Συμπεριφορά ανά πλατφόρμα
Jetson Nano 8GB
GPU_SINGLE
1
tiled_gpu (σειριακή)
Λειτουργία αποδοτικής χρήσης μνήμης, επεξεργάζεται μία εικόνα κάθε φορά
Jetson Orin NX 16GB
GPU_PARALLEL
3
fused_gpu (ταυτόχρονη)
Συνιστώμενη συσκευή edge — πραγματική παράλληλη επεξεργασία GPU
Jetson AGX Orin 64GB
GPU_PARALLEL
4
fused_gpu (ταυτόχρονη)
Μέγιστη απόδοση περιφερειακών συσκευών
Επιτραπέζιος υπολογιστής με GPU 8 GB
GPU_SINGLE
3
tiled_gpu
Καλή απόδοση επιτραπέζιου υπολογιστή με πλακίδια αποδοτικής χρήσης μνήμης
Επιτραπέζιος υπολογιστής με GPU 12 GB+
GPU_PARALLEL
3-4
fused_gpu
Βέλτιστη απόδοση επιτραπέζιου υπολογιστή
Σύστημα μόνο με CPU
CPU_PARALLEL
πυρήνες - 1
cpu_fallback
Δεν απαιτείται GPU, χρησιμοποιεί ThreadPool
Ενοποιημένη μνήμη Jetson: Οι συσκευές Jetson μοιράζονται τη μνήμη της GPU και της CPU. Ένα Jetson Orin NX 16GB αναφέρει ~15,3GB VRAM, αλλά αυτή είναι η ίδια φυσική RAM που χρησιμοποιείται από το λειτουργικό σύστημα και τις διεργασίες της CPU. Το Chloros λαμβάνει αυτό υπόψη κατά τον καθορισμό των ορίων κατανομής μνήμης.
Δυναμική κατανομή μνήμης GPU
Το Chloros χρησιμοποιεί έναν αγωγό επεξεργασίας 4 νημάτων:
Νήμα 1 (Ανίχνευση) — Φόρτωση εικόνας, ανάλυση EXIF, ανίχνευση στόχου
Νήμα 2 (Βαθμονόμηση) — Υπολογισμός βαθμονόμησης ανακλαστικότητας
Νήμα 3 (Επεξεργασία) — Αποσυμπίεση GPU, διόρθωση βινιέτας, υπολογισμός δείκτη
Νήμα 4 (Εξαγωγή) — Εγγραφή αρχείου, ενσωμάτωση μεταδεδομένων
Καθώς τα προηγούμενα νήματα της ροής ολοκληρώνουν την εργασία τους (π.χ., έχουν ανιχνευθεί όλες οι εικόνες), η κατανομή μνήμης GPU που τους αντιστοιχεί απελευθερώνεται και αναδιανέμεται στα υπόλοιπα ενεργά νήματα. Αυτό σημαίνει ότι το Νήμα 3 (το στάδιο που απαιτεί εντατική χρήση της GPU) λαμβάνει προοδευτικά περισσότερη μνήμη καθώς προχωρά η ροή εργασιών, βελτιώνοντας την απόδοση για τις εργασίες που απαιτούν την πιο εντατική υπολογιστική ισχύ.
Στάδια Κατανομής
Πρώιμο
1, 2, 3, 4
Κατανομή σε όλα τα νήματα
Αρχικό-Μεσαίο
2, 3, 4
Η μνήμη του νήματος 1 αναδιανέμεται
Μεσαίο-Τελικό
3, 4
Η μνήμη των νημάτων 1+2 μεταφέρεται στα 3+4
Τελικό
3 ή 4
Μέγιστη μνήμη για το υπόλοιπο νήμα
Επεξεργασία με αναγνώριση υφής
Η μέθοδος αποσυμπίεσης με αναγνώριση υφής (μόνο Chloros+) χρησιμοποιεί σημαντικά περισσότερη μνήμη GPU από τη μέθοδο Standard λόγω του μοντέλου αποθορυβοποίησης AI/ML:
Τα συστήματα με < 7GB VRAM αναγκάζονται να χρησιμοποιούν έναν βρόχο συγχρονισμένης επεξεργασίας για τη λειτουργία με αναγνώριση υφής (μία εικόνα κάθε φορά)
Τα συστήματα με 7GB+ VRAM μπορούν να επεξεργάζονται με Texture Aware ταυτόχρονα, αν και με μειωμένο αριθμό εργαζομένων σε σύγκριση με την Standard***
Διαχείριση θερμοκρασίας (Jetson)
Οι συσκευές Jetson έχουν θερμικούς περιορισμούς, ειδικά σε κλειστές ή αερομεταφερόμενες εγκαταστάσεις. Το Chloros παρακολουθεί τις θερμοκρασίες της GPU και της CPU και προσαρμόζει αυτόματα την επεξεργασία:
< 70°C
Κανονική λειτουργία — πλήρης ταχύτητα
70°C (Προειδοποίηση)
Μείωση μεγέθους παρτίδας
80°C (Κρίσιμη κατάσταση)
Εντατική μείωση ταχύτητας — μείωση ταυτόχρονης επεξεργασίας και αριθμού εργαζομένων
90°C (Τερματισμός)
Πλήρης διακοπή επεξεργασίας GPU
Η παρακολούθηση θερμοκρασίας χρησιμοποιεί το tegrastats σε πλατφόρμες Jetson. Σε επιτραπέζιους υπολογιστές με επαρκή ψύξη, η θερμική επιβράδυνση ενεργοποιείται σπάνια.
Διαχείριση πίεσης μνήμης
Το Chloros παρακολουθεί την πίεση μνήμης του συστήματος κατά τη διάρκεια της επεξεργασίας:
Όριο μνήμης: Η χρήση κατά 85% ενεργοποιεί συντηρητική συμπεριφορά
Μείωση OOM: Εάν συμβεί συμβάν εξάντλησης μνήμης, η κατανομή μειώνεται κατά 25% (πολλαπλασιαστής 0,75x)
Εναλλακτική λύση αγωγού: Υπό σοβαρή πίεση μνήμης, ο αγωγός επιστρέφει αυτόματα από το
fused_gpuστοtiled_gpuΣυστάσεις ανταλλαγής: Στο Jetson, το Chloros σας προειδοποιεί εάν ο χώρος ανταλλαγής είναι ανεπαρκής για το μέγεθος του συνόλου δεδομένων σας***
Παρακολούθηση προσαρμογής υπολογιστικής ισχύος
Έξοδος κατάστασης CLI
Όταν ξεκινά η επεξεργασία, το CLI εμφανίζει το προφίλ υλικού που ανιχνεύθηκε:
Διαγνωστικά συστήματος
Εκτελέστε το chloros-cli selftest για να δείτε ένα πλήρες προφίλ υλικού και να επαληθεύσετε τις υπολογιστικές δυνατότητες:
Αυτό ελέγχει τη διαθεσιμότητα CUDA, τη μνήμη GPU, τα μοντέλα αποθορυβοποίησης και τη συνδεσιμότητα του backend.
Επόμενα βήματα
Αγωγός επεξεργασίας — Κατανόηση της αρχιτεκτονικής αγωγού 4 νημάτων
Οδηγός NVIDIA Jetson — Ανάπτυξη και βελτιστοποίηση ειδικά για Jetson
CLI : Γραμμή εντολών — Πλήρης αναφορά CLI
Last updated