Etica della virtu e sistemi AI
Non “cosa devo fare?”, non “quale regola si applica?”, ma “che persona, o che sistema, dovrei diventare?” La domanda piu antica della filosofia morale, riformulata come terzo framework normativo per l’AI accanto a consequenzialismo e deontologia.
“Le virtu non nascono in noi ne per natura ne contro natura, ma noi siamo per natura atti a riceverle, e tale attitudine viene perfezionata mediante l’abitudine.” — Aristotele, Etica Nicomachea, libro II, capitolo 1, ca. IV secolo a.C. (1103a 23-26 nella numerazione Bekker).
Atene, IV secolo a.C., l’area boscosa dedicata ad Apollo Liceo a est della citta. Aristotele cammina avanti e indietro lungo il peristilio della scuola che ha aperto dopo la morte di Platone, e dispiega davanti a un pubblico di discepoli un’etica che non parte da regole, ne da calcoli di felicita, ne da comandi divini. Parte da una domanda diversa: che vita merita di essere chiamata buona, e chi sa viverla? Le risposte che Aristotele articola in dieci libri di appunti, raccolti dal figlio Nicomaco e tramandati come Etica Nicomachea, definiscono il vocabolario di un programma morale che attraversera due millenni con fortune alterne, scomparira quasi del tutto nel periodo moderno, e tornera al centro della filosofia analitica nel 1958 grazie a un articolo di diciannove pagine.
Ventitre secoli dopo, una filosofa statunitense pubblica un libro che chiede come le virtu aristoteliche, mediate dal revival novecentesco, possano orientare le pratiche umane in un mondo trasformato da intelligenza artificiale, biotecnologie, sorveglianza, social media. Shannon Vallor in Technology and the Virtues (Oxford UP 2016) non scrive di Aristotele come archeologia: scrive di come le sue categorie possano essere riformulate per contesti che il filosofo ateniese non poteva immaginare. Il filo che collega Atene IV secolo a.C. a Edinburgh 2016 e’ una filiazione esplicita e dichiarata, non un’analogia debole: Vallor cita Aristotele alla pagina 1 e in tutto il libro, e si situa coscientemente nella tradizione virtue ethics novecentesca.
Il capitolo segue questo filo, mantenendo distinte le componenti storiche da quelle contemporanee. Il corpo storico parla di Aristotele, Anscombe, MacIntyre, Foot, Hursthouse, Annas, Vallor nel loro tempo. La connessione con AI contemporanea (Constitutional AI, sycophancy, character-design degli LLM) vive nelle sezioni dedicate “Eredita oggi” e “Collegamenti”, non nei paragrafi storici.
Perche questo capitolo
Sezione intitolata “Perche questo capitolo”Le grandi famiglie di etica normativa, nella tradizione occidentale, sono tre: consequenzialismo (cap 51), deontologia (cap 52), virtue ethics. Le prime due hanno avuto il monopolio del discorso normativo dal Settecento al primo Novecento; la terza e’ tornata al centro della filosofia analitica solo dopo il 1958 e ha ricevuto applicazione sistematica all’etica della tecnologia solo dopo il 2016. E’ la piu antica delle tre come tradizione, e la piu recente come voce contemporanea su AI.
Il capitolo serve a vedere strenghts e limiti del framework virtue applicato all’AI. Lo strength principale: virtue ethics sposta l’oggetto di valutazione dall’azione (utilita prodotta? regola rispettata?) all’agente (che disposizioni stabili ha?). Lo spostamento e’ rilevante per AI in due modi distinti. Primo, gli LLM contemporanei hanno “personality” emergente dal training: stili di interazione, tendenze al rifiuto, pattern di onesta o di compiacenza che si manifestano stabilmente, non per singola risposta. Quel “qualcosa” e’ meglio descritto come carattere disposizionale che come sequenza di scelte isolate. Secondo, sistemi che operano in tempi lunghi (agentic systems, AI assistants long-running, AI in care relationships) richiedono una valutazione di stabilita disposizionale che le altre due famiglie faticano a catturare.
I limiti principali: virtu richiedono phronesis (saggezza pratica), che Aristotele ancora a esperienza vitale incarnata; AI manca di esperienza biologica autentica e l’analogo funzionale e’ contestato. Virtu sono storicamente situate (MacIntyre 1981): quale tradizione adottare per un sistema globale? La sistematizzazione contemporanea (Hursthouse 1999) risponde a critiche di vagueness applicativo, ma il problema “cosa farebbe un agente virtuoso?” resta meno operazionalizzabile di “cosa massimizza utilita?” o “quale regola si applica?”. Capire dove la tensione si rompe e’ parte del lavoro del capitolo.
Una nota di metodo. Constitutional AI di Anthropic (Bai et al. 2022, arXiv:2212.08073) e l’acronimo HHH (Helpful, Honest, Harmless, Askell et al. 2021) sono spesso citati come “applicazione di virtue ethics all’AI”. La lettura e’ parzialmente vera e parzialmente fuorviante: si trattera in dettaglio in “Eredita oggi” e in “Dove si rompe”, e si distingueranno gli aspetti virtue-like (carattere emergente, integrazione disposizionale, helpful/honest/harmless come triade) dagli aspetti che restano deontologici (regole esplicite nella costituzione) o consequenzialisti (loop RLAIF). La triade non e’ applicazione di virtue ethics in senso stretto; e’ un design pattern che si presta a lettura virtue-friendly.
Contesto
Sezione intitolata “Contesto”La storia della virtue ethics ha un punto di nascita identificabile e una traiettoria a tre tempi: classico, eclissi, revival.
Il tempo classico comincia con Aristotele (filosofo greco, Stagira 384-322 a.C., allievo di Platone, precettore di Alessandro Magno), che fonda al Liceo di Atene una scuola peripatetica e redige in dieci libri l’Etica Nicomachea (cosi chiamata perche dedicata o curata dal figlio Nicomaco; esiste un’altra etica aristotelica, la Etica Eudemia, di cui tre libri sono identici). La datazione e’ incerta: probabile redazione fra il 335 e il 322 a.C., negli anni della seconda permanenza ateniese di Aristotele. Il testo articola un programma sistematico: l’etica e’ parte della filosofia pratica, lo scopo della vita umana e’ eudaimonia (fioritura), la fioritura si raggiunge attraverso l’esercizio delle virtu (arete) della parte razionale dell’anima, le virtu sono di due tipi (morali e dianoetiche), si acquisiscono via habituation guidata dalla phronesis (saggezza pratica).
L’eredita aristotelica passa attraverso la tradizione stoica (Seneca, Epitteto, Marco Aurelio), che riprende il vocabolario delle virtu adattandolo a una metafisica panteistica. Riceve un secondo grande sistema con Tommaso d’Aquino (filosofo e teologo italiano, Roccasecca 1225 - Fossanova 1274, domenicano, allievo di Alberto Magno a Parigi e Colonia), che nella Summa Theologica (1265-1274), seconda parte della seconda parte (II-II), integra Aristotele con la teologia cristiana. Tommaso aggiunge alle quattro virtu cardinali aristoteliche-platoniche (prudenza, giustizia, fortezza, temperanza) le tre virtu teologali paoline (fede, speranza, carita). La sintesi tomistica resta dominante nell’occidente cattolico per secoli.
Il tempo dell’eclissi comincia con la Riforma e l’Illuminismo. La rottura con la tradizione scolastica, l’autonomia dell’individuo razionale, l’emergere di nuove forme di legittimazione politica spostano il centro dell’etica. Kant nel 1785 fonda la deontologia su ragione individuale (vedi etica-deontologica-ai); Bentham nel 1789 fonda l’utilitarismo su calcolo edonico (vedi etica-consequenzialista-ai). La virtue ethics aristotelica scompare dalla filosofia accademica anglofona per quasi due secoli. Resta viva nei seminari teologici e in alcune correnti continentali, ma non e’ voce nel dibattito normativo di prima linea.
Il tempo del revival comincia nel gennaio 1958. Gertrude Elizabeth Margaret Anscombe (filosofa britannica, 1919-2001, allieva di Ludwig Wittgenstein a Cambridge, professoressa a Cambridge e poi Oxford, cattolica praticante) pubblica su Philosophy (rivista della Royal Institute of Philosophy) un articolo di diciannove pagine: Modern Moral Philosophy. Tre tesi: la filosofia morale moderna senza un’adeguata filosofia della psicologia non puo procedere; i concetti di “moral obligation” e “moral duty” sono residui non funzionali di una concezione legale-divina dell’etica e non hanno senso senza un legislatore divino; la filosofia morale dovrebbe abbandonare il vocabolario “moral” e ripartire da concetti come “ingiusto”, “intemperante”, “vile”, che hanno radice nelle virtu aristoteliche. Anscombe conia anche, nello stesso articolo, il termine “consequentialism” come categoria che include utilitarismo e tutte le etiche che valutano azioni dalle conseguenze.
L’articolo apre il revival. Philippa Foot (filosofa britannica, 1920-2010, nipote di Grover Cleveland presidente USA, Oxford), che nel 1967 inventa quasi accidentalmente il trolley problem in un articolo sulla doctrine of double effect, sviluppa virtue ethics in Virtues and Vices (Blackwell 1978) e poi in Natural Goodness (Clarendon Press, Oxford 2001). Alasdair MacIntyre (filosofo scozzese-statunitense, 1929-2025, Notre Dame Indiana dopo carriera britannica, formazione marxista poi tomismo aristotelico) pubblica After Virtue (University of Notre Dame Press 1981), uno dei libri filosofici piu citati del secondo Novecento dopo Rawls 1971. Bernard Williams (filosofo britannico, 1929-2003, Cambridge) pubblica nel 1973 Utilitarianism: For and Against (con J.J.C. Smart, Cambridge UP) e nel 1985 Ethics and the Limits of Philosophy (Harvard UP), che critica il “morality system” (utilitarismo + kantianesimo) in modi compatibili con il revival virtue, anche se Williams non si auto-classifica come virtue ethicist. Rosalind Hursthouse (filosofa neozelandese, 1943-, allieva di Foot) sistematizza virtue ethics in On Virtue Ethics (Oxford UP 1999). Julia Annas (filosofa statunitense, 1946-, University of Arizona, classicista e filosofa morale) pubblica Intelligent Virtue (Oxford UP 2011), che riformula virtu sul modello dello skill expertise.
Il punto di contatto con AI arriva tardi. Shannon Vallor (filosofa statunitense, 1972-, Edinburgh University dopo Santa Clara, prima cattedra Baillie Gifford in Ethics of Data and AI dal 2020) pubblica Technology and the Virtues: A Philosophical Guide to a Future Worth Wanting (Oxford UP 2016). E’ la prima monografia sistematica che applica virtue ethics aristotelica (mediata dal revival anglofono novecentesco e integrata con tradizioni confuciana e buddhista) a tecnologie emergenti incluse AI, biotech, social media, sorveglianza. Il libro propone un catalogo di dodici “technomoral virtues” e diventa riferimento standard per chi applica virtue ethics a AI ethics. Anteriore a Vallor, alcuni saggi minori avevano gia esplorato connessioni virtue-AI (Wallach-Allen 2009 menzionano l’approccio fra altri), ma e’ Vallor a fornire la trattazione monografica.
L’incontro fra virtue ethics e AI design e’ ancora in fase iniziale. Constitutional AI di Anthropic (dicembre 2022) e’ spesso citato come “primo tentativo virtue-influenced”, ma la lettura va qualificata: Anthropic non cita Vallor ne Aristotele, e l’architettura e’ principalmente deontologica-consequenzialista ibrida. Il rapporto e’ di somiglianza strutturale parziale, non di filiazione documentata. Si tornera in dettaglio.
L’intuizione
Sezione intitolata “L’intuizione”Due angoli per afferrare virtue ethics prima di vederla formalizzata. Uno e’ filosofico: la domanda etica fondamentale non e’ “cosa fare?” ma “che persona/sistema essere?”. L’altro e’ operativo: gli LLM hanno carattere emergente dal training, e parlare di carattere richiede categorie virtue-like.
Angolo filosofico
Sezione intitolata “Angolo filosofico”Considera come tre persone diverse rispondono a un dilemma morale. Il primo calcola: questa azione massimizza il benessere aggregato? Se si, e’ giusta; se no, no. E’ la mossa consequenzialista. Il secondo verifica: questa azione viola una regola che vincola incondizionatamente? Se no, e’ permessa; se si, vietata. E’ la mossa deontologica. Il terzo si chiede: che persona divento facendo questo? E’ un’azione che una persona di buon carattere farebbe nelle circostanze? E’ la mossa virtue.
I tre approcci possono concordare nel giudizio sull’azione specifica, ma differiscono in cio che pongono al centro. Per il consequenzialista, l’azione e’ strumento per produrre stati di mondo; conta il risultato. Per il deontologo, l’azione e’ applicazione di principio; conta la conformita. Per il virtuista, l’azione e’ espressione del carattere; conta chi la fa e con quale disposizione.
La mossa virtue e’ nuda quanto le altre due, e ha la stessa struttura concettuale: identifica un’oggetto primario di valutazione (per il consequenzialista, le conseguenze; per il deontologo, la regola; per il virtuista, il carattere) e lo dichiara fondamentale. La differenza e’ su quale oggetto si sceglie. La conseguenza pratica della scelta e’ che il vocabolario morale cambia: si parla di “saggezza”, “coraggio”, “temperanza”, “magnanimita”, “umilta”, non di “utilita” o “dovere”.
L’attrazione filosofica della virtue ethics e’ la sua capacita di catturare la dimensione narrativa della vita morale. Non valutiamo le persone azione per azione, come se ognuna fosse un evento isolato. Le valutiamo come carattere coerente: chi e’, come si comporta abitualmente, che disposizioni stabili manifesta nel tempo. Una singola buona azione fatta da una persona vile non la rende virtuosa; una singola cattiva azione fatta da un virtuoso non lo distrugge. La virtu e’ stabilita disposizionale, non somma di scelte.
C’e anche un’attrazione legata alla phronesis. La saggezza pratica giudica casi concreti senza ricondurli a regole generali. Aristotele nel libro VI dell’Etica Nicomachea dice che il phronimos vede cosa fare in questa situazione, in questo momento, con queste persone. Il giudizio non e’ deduzione da principi: e’ percezione di cio che la situazione richiede. Iris Murdoch (filosofa britannica, 1919-1999, The Sovereignty of Good, 1970) la chiama “moral perception”: vedere bene la realta moralmente rilevante richiede attenzione e disposizione, non solo intelletto.
Angolo operativo
Sezione intitolata “Angolo operativo”L’angolo operativo parte dalla constatazione che gli LLM contemporanei hanno qualcosa che assomiglia a un carattere. Non singole risposte, ma pattern stabili di interazione. Claude (Anthropic), ChatGPT (OpenAI), Gemini (Google), Llama (Meta) hanno stili distinguibili: modi diversi di gestire disaccordo, livelli diversi di formalita, soglie diverse per il rifiuto, tendenze diverse all’umilta epistemica o all’assertivita. Le differenze sono empiricamente osservabili: chi interagisce regolarmente con piu modelli le riconosce.
Quel “qualcosa” emerge dal training (pretraining + post-training + RLHF/RLAIF + system prompt + constitutional principles, in proporzioni che variano per modello) ed e’ stabile su scala di milioni di interazioni. Non e’ una scelta deliberata in ogni singolo turno: e’ una disposizione del sistema che si manifesta come pattern statistico stabile. La struttura concettuale assomiglia all’hexis aristotelica (disposizione stabile del carattere) molto piu’ che a una regola applicata caso per caso o a una funzione obiettivo massimizzata.
L’attrazione operativa della virtue ethics e’ la possibilita di parlare di questo carattere usando un vocabolario che ha duemila anni di sviluppo. Invece di dire “il modello tende a comportamento X in classe di situazioni Y con probabilita Z”, si puo dire “il modello manifesta una disposizione a virtu V, oppure il vizio opposto V’”. Il vocabolario e’ piu compatto, piu intuitivo, piu adatto alla comunicazione con utenti non tecnici.
C’e anche un risvolto tecnico interessante. Constitutional AI (Bai et al. 2022) tenta di influenzare il carattere emergente attraverso principi nella “costituzione”. L’idea non e’ “applica questa regola a ogni risposta” (sarebbe deontologia stretta) ne “massimizza questa funzione” (sarebbe consequenzialismo stretto), ma “diventa un sistema con disposizioni di tipo X”. Il design pattern e’ character-design, e ha tratti virtue-like. Ma non e’ virtue ethics applicata in senso stretto, e si vedra perche’ in “Dove si rompe”.
I due angoli convergono nel mostrare che virtue ethics offre una griglia interpretativa per fenomeni reali (carattere emergente degli LLM, sycophancy come pattern stabile, comportamenti di care e empathy in agenti long-running) che le altre due famiglie faticano a catturare. Non sostituisce consequenzialismo e deontologia: si affianca, e fornisce un linguaggio complementare per parlare di disposizioni del sistema, non solo di azioni o regole.
La meccanica
Sezione intitolata “La meccanica”Aristotele: eudaimonia, hexis, mesotes, phronesis
Sezione intitolata “Aristotele: eudaimonia, hexis, mesotes, phronesis”Aristotele apre l’Etica Nicomachea (libro I, cap. 1) con una constatazione: ogni arte, ogni indagine, ogni azione mira a un bene. Lo scopo dell’etica e’ identificare il bene supremo per l’uomo, quello a cui tutti gli altri sono subordinati. La risposta che Aristotele articola in dieci libri richiede di introdurre quattro concetti chiave intrecciati: eudaimonia, hexis, mesotes, phronesis.
Eudaimonia (libro I, cap. 7-12). Termine intraducibile. “Felicita” e’ fuorviante perche’ suggerisce stato emotivo soggettivo. “Fioritura” o “vita buona” rendono meglio. Eudaimonia e’ la vita oggettivamente realizzata di chi esercita pienamente la propria natura razionale. Non e’ un sentimento, e’ un modo di vivere: stabile, attivo, completo.
L’argomento della funzione (libro I, cap. 7, 1097b 22 ss.): se ogni cosa ha una funzione (ergon) propria, la sua eccellenza consiste nel fare bene quella funzione. La funzione propria dell’uomo non puo essere il vivere (lo condivide con piante e animali) ne il sentire (lo condivide con animali); deve essere l’attivita razionale dell’anima. La virtu umana e’ fare bene tale attivita. La vita buona e’ vita razionale virtuosa.
Eudaimonia non e’ meta esterna alla virtu. E’ la virtu stessa esercitata in una vita completa. Aristotele e’ esplicito (libro I, cap. 8): non basta avere virtu, bisogna esercitarle; e bisogna esercitarle nell’arco di una vita intera, non in episodi. “Una rondine non fa primavera, ne lo fa un giorno solo; cosi anche un giorno solo o un breve tempo non fa l’uomo beato e felice”.
Hexis (libro II, cap. 1-6). Stato disposizionale stabile del carattere. La virtu non e’ una capacita (potenza che si puo esercitare o no), non e’ un sentimento (passione che si subisce), non e’ una singola azione: e’ una disposizione del carattere acquisita tramite habituation. Una persona generosa non e’ chi compie occasionalmente atti generosi (puo essere casualita), ne chi sente impulso a generosita (puo non agire), ma chi ha la disposizione stabile a esserlo, in modo affidabile, anche in circostanze nuove.
Due caratteristiche cruciali della hexis: stabilita (la virtu e’ affidabile attraverso situazioni diverse) e riflettivita (la virtu include il giudizio su come applicarla nel caso particolare, non e’ automatismo).
Mesotes (libro II, cap. 6-9). Ogni virtu morale e’ la “via di mezzo” fra due vizi: uno per eccesso, uno per difetto. Esempi canonici aristotelici:
- Coraggio = mezzo fra vilta (difetto: si fugge cio che non si dovrebbe) e temerarieta (eccesso: si affronta cio che non si dovrebbe).
- Temperanza = mezzo fra insensibilita (difetto) e dissolutezza (eccesso).
- Liberalita = mezzo fra avarizia (difetto) e prodigalita (eccesso).
- Magnificenza = mezzo fra grettezza (difetto, per spese pubbliche) e volgarita ostentatoria (eccesso).
- Mansuetudine = mezzo fra apatia (difetto: non ci si arrabbia mai, anche dove si dovrebbe) e iracondia (eccesso).
- Veridicita = mezzo fra dissimulazione (difetto) e vanteria (eccesso).
- Spirito (eutrapelia) = mezzo fra rusticita (difetto, non sa scherzare) e buffonneria (eccesso).
- Modestia (verecondia) = mezzo fra timidezza eccessiva (difetto) e sfrontatezza (eccesso).
Il “mezzo” non e’ aritmetico ne universale. Aristotele e’ esplicito (libro II, cap. 6, 1106a 26 ss.): e’ il mezzo “rispetto a noi”, determinato dalla phronesis nel caso concreto. La giusta dose di coraggio per un soldato in battaglia e’ diversa da quella per un cittadino in tribunale. Il mezzo non si calcola, si percepisce con saggezza.
Eccezioni esplicite: alcune azioni non hanno mesotes. Adulterio, omicidio, furto sono sempre cattivi, qualunque sia “la dose”. Non c’e modo virtuoso di commetterli (libro II, cap. 6, 1107a 9-15). Il mesotes vale solo per virtu il cui oggetto ammette gradi.
Phronesis (libro VI, cap. 5-11). Saggezza pratica. Virtu dianoetica chiave. Capacita di deliberare bene su cio che e’ bene per l’uomo nelle situazioni concrete. Non si confonde con sophia (sapienza teorica, conoscenza del necessario ed eterno) ne con techne (sapere produttivo, sapere fare oggetti).
Phronesis e’ essenziale per la virtu morale: senza phronesis non si sa quale azione e’ la giusta dose nel caso. Il coraggioso deve sapere quanto rischio assumersi, quando ritirarsi, quando resistere. La phronesis si sviluppa via esperienza, non si insegna in modo teorico. Per questo i giovani possono essere bravi in matematica ma raramente sono “phronimoi”: manca esperienza vissuta.
La phronesis ha tre elementi: percezione del particolare (vedere cosa la situazione e’), deliberazione su mezzi (cosa fare per produrre il fine virtuoso), giudizio sull’azione concreta. E’ un’intelligenza pratica orientata all’azione, non un sapere universale orientato alla contemplazione.
Habituation (libro II, cap. 1, 1103a 14 ss.). La virtu si acquisisce praticando azioni virtuose. “Diventiamo giusti facendo cose giuste, temperati facendo cose temperate, coraggiosi facendo cose coraggiose”. Inizialmente l’azione e’ guidata da educazione esterna (genitori, leggi, modelli); col tempo si interiorizza e diventa disposizione propria.
L’habituation e’ il meccanismo causale della formazione della virtu. Aristotele e’ chiaro che non basta capire teoricamente cosa sia la virtu (lo studio dell’etica non rende virtuosi); bisogna agire ripetutamente in modo virtuoso, finche la disposizione si forma. La virtu e’ praxis, non episteme.
Anscombe 1958: il rilancio
Sezione intitolata “Anscombe 1958: il rilancio”L’articolo Modern Moral Philosophy di Anscombe (gennaio 1958, Philosophy 33, no. 124, pp. 1-19) e’ il momento di nascita del revival contemporaneo. Diciannove pagine, tre tesi, conseguenze durature.
Prima tesi: la filosofia morale moderna senza un’adeguata filosofia della psicologia non puo procedere proficuamente. Le categorie di “intenzione”, “azione”, “virtu”, “vizio” richiedono una psicologia filosofica che la tradizione analitica non ha sviluppato. Anscombe stessa nel 1957 pubblica Intention (Blackwell), il libro fondativo della filosofia dell’azione contemporanea, per colmare questa lacuna.
Seconda tesi: i concetti di “moral obligation”, “moral duty”, “morally right/wrong” sono residui non funzionali di una concezione legale-divina dell’etica. Senza un Dio legislatore, non hanno fondamento. Sono “frammenti” di un sistema collassato. La tradizione kantiana che li ha mantenuti senza fondamento divino li ha conservati come meri schemi formali, e l’utilitarismo li ha reinterpretati strumentalmente. In entrambi i casi, sono fuori contesto.
Terza tesi: la filosofia morale dovrebbe abbandonare il vocabolario “moral” cosi inteso e ripartire da concetti come “ingiusto”, “intemperante”, “vile”, “imprudente”, che hanno radice nelle virtu aristoteliche. Questi concetti hanno contenuto descrittivo-valutativo intrinseco: dire che un’azione e’ “ingiusta” non e’ applicare un’etichetta esterna, e’ descriverla in termini che includono valutazione.
L’articolo conia anche, nello stesso passaggio, il termine “consequentialism” come categoria che include utilitarismo e tutte le etiche che valutano azioni dalle conseguenze. La parola era stata usata occasionalmente prima, ma con Anscombe diventa termine standard del vocabolario filosofico.
L’impatto e’ enorme. Anscombe ha autorita: e’ allieva di Wittgenstein, traduttrice e interprete (la sua versione delle Philosophical Investigations del 1953 e’ standard), professoressa a Cambridge poi Oxford, cattolica praticante con posizioni etiche conservatrici. Il pubblico anglofono dell’epoca, dominato da utilitarismo e da neo-kantianesimo, riceve l’articolo come provocazione seria. Foot, MacIntyre, Hursthouse, Williams citano Anscombe come momento di svolta.
Il revival e’ stato a lungo letto come risposta cattolica/aristotelica al dominio analitico utilitarista-kantiano. La lettura coglie un aspetto, ma e’ parziale: il revival ha incluso voci non religiose (Foot, Williams, Annas) e si e’ separato in tradizioni diverse (eudaimonista, agent-based, target-centred, ethics of care).
MacIntyre: After Virtue
Sezione intitolata “MacIntyre: After Virtue”Alasdair MacIntyre pubblica After Virtue nel 1981 (University of Notre Dame Press; seconda edizione 1984; terza edizione 2007 con postfazione). E’ uno dei libri filosofici piu citati del secondo Novecento.
Diagnosi: la modernita morale e’ in crisi profonda. Il vocabolario etico contemporaneo (diritti, dovere, utilita, autonomia) e’ frammento di tradizioni distrutte (aristotelica, cristiana, classica). I disaccordi morali contemporanei sono interminabili perche’ mancano di criteri condivisi. Esempio paradigmatico: dibattiti su aborto, guerra giusta, distribuzione si arenano in stallo perche’ i partecipanti partono da quadri etici incompatibili e nessuna autorita comune puo dirimere.
Genealogia del declino (la “disquieting suggestion” del capitolo 1):
- Aristotele e medioevo. Etica fondata su telos (fine umano), tradizione coerente, virtu definite in rapporto a una concezione condivisa di vita buona.
- Riforma e Illuminismo. Rifiuto di telos. Tentativo di fondare etica su ragione individuale (Kant), su utilita (Bentham), su sentimento (Hume). Ognuno fallisce perche’ non puo recuperare la teleologia.
- Risultato (XX secolo): emotivismo. L’etica si riduce a espressione di preferenze. La diagnosi recupera Stevenson 1944 (Ethics and Language) e Ayer 1936 (Language, Truth and Logic), che MacIntyre legge non come teorie filosofiche ma come stato di fatto culturale.
Ricostruzione: ritorno a tradizione aristotelica via triade concettuale.
- Practices: attivita socialmente strutturate con beni interni. Esempi: scacchi, medicina, agricoltura, ricerca scientifica, musica. Una pratica ha standard di eccellenza interna e produce beni che si possono ottenere solo partecipando alla pratica stessa. Le virtu si esercitano in pratiche.
- Narratives: la vita umana ha unita narrativa. Capire un’azione richiede situarla nella narrazione di una vita. Le virtu sono cio che permette di vivere bene la propria narrazione, e di legarla a narrazioni piu ampie (familiari, comunitarie, storiche).
- Traditions: tradizioni storiche di pratiche e narrazioni che si tramandano e si rinegoziano. Senza tradizione viva non c’e accordo sui beni interni alle pratiche, e quindi non c’e virtu coerente. La modernita ha frammentato le tradizioni e quindi reso impossibile la virtu in senso pieno.
L’opera ha avuto influenza enorme su comunitarismo politico (Sandel, Taylor, Walzer), su filosofia teologica cattolica, su dibattito sull’autorita morale. E’ stata contestata da liberal (per anti-modernismo) e da analitici (per genealogia “letteraria”). Apprezzata da virtue ethicists, conservatori filosofici, comunitaristi.
Ricaduta su AI: MacIntyre non scrive di AI, ma la sua tesi della tradizione-relativita delle virtu e’ un limite serio per virtue ethics applicata a sistemi globali. Quale tradizione adotta un’AI che opera in cento paesi? Vallor risponde sintetizzando piu tradizioni; MacIntyre direbbe che la sintesi e’ artificiale, non puo sostituire l’appartenenza viva a una comunita di pratica.
Foot: natural goodness
Sezione intitolata “Foot: natural goodness”Philippa Foot vira da una posizione iniziale neo-kantiana a virtue ethics aristotelica. La traiettoria culmina in Natural Goodness (Clarendon Press, Oxford 2001).
Tesi: la valutazione morale e’ una specie particolare di valutazione di “natural goodness”, la stessa che applichiamo a piante, animali, organi. Diciamo “questa quercia e’ una buona quercia” se ha radici robuste, foglie sane, capacita di resistere a tempeste. Diciamo “questo leone e’ un buon leone” se caccia bene, si riproduce, protegge il branco. Analogamente, possiamo dire “questo essere umano e’ un buon essere umano” se esercita le virtu proprie della specie umana.
L’etica e’ naturalistica: la bonta umana e’ un fatto biologico-naturale, non un’aggiunta culturale o emotiva. Le virtu umane (giustizia, coraggio, prudenza, temperanza, eccetera) sono cio che fa di un essere umano un buon essere umano, dato cosa l’essere umano e’.
L’argomento risponde a un problema vecchio della metaetica: come si passa da fatti a valori? Per Foot, non c’e passaggio: i fatti biologici della specie umana includono gia valutazioni intrinseche (cosa e’ buono per la specie). G.E. Moore aveva diagnosticato la “naturalistic fallacy” all’inizio del XX secolo, sostenendo che derivare “is” da “ought” e’ fallacia. Foot, in compagnia di Anscombe e altri, sostiene che la fallacia si applica solo se si assume la separazione cartesiana fra fatto e valore; per chi parte da una concezione organica/aristotelica della natura, non c’e fallacia.
Implicazione: le virtu sono species-relative. Quali siano le virtu di un’entita dipende dalla sua natura. Questo apre due questioni per AI. Prima: qual e’ la “natura” di un’AI? Se non c’e natura definita, l’analogia con leoni e querce non si applica. Seconda: chi decide cosa fa di un’AI un “buon” sistema? Per Foot, la natura della specie umana e’ un dato biologico-storico; per AI, la “natura” e’ costruita da designer, e quindi le virtu sono costruite, non scoperte.
Hursthouse: sistematizzazione
Sezione intitolata “Hursthouse: sistematizzazione”Rosalind Hursthouse pubblica On Virtue Ethics (Oxford UP 1999), che sistematizza virtue ethics come framework normativo competitivo con utilitarismo e kantianesimo.
Tesi normativa centrale: “An action is right iff it is what a virtuous agent would characteristically do in the circumstances”.
La formula risponde a critiche di vagueness applicativo. Chi e’ “virtuous agent”? E’ chi ha le virtu (lista specificabile: giustizia, coraggio, temperanza, prudenza, generosita, onesta, fedelta, gratitudine, amicizia, umilta, eccetera). Quali sono le virtu? Sono quelle disposizioni che permettono fioritura umana (eudaimonia). La definizione e’ circolare ma non viziosamente: e’ un olismo concettuale, in cui virtu e fioritura si definiscono reciprocamente.
Hursthouse risponde anche a critiche di inapplicabilita: come si decide in un caso concreto? Risposta: si chiede “cosa farebbe un agente con le virtu rilevanti, in queste circostanze, con questa informazione disponibile?” Esercizio difficile ma non impossibile, esattamente come in altri framework si chiede “cosa massimizza utilita?” o “quale regola si applica?”. Tutti i framework hanno indeterminatezza applicativa; virtue ethics non e’ peggiore, e’ piu onesta nell’ammetterla.
Hursthouse ha applicato il framework a casi controversi: aborto (articolo del 1991 in Philosophy & Public Affairs, classico nella discussione), eutanasia, applied ethics in generale. Ha mostrato che virtue ethics non e’ “soft” ne necessariamente “vague”: e’ framework normativo serio, capace di prendere posizione su casi difficili.
Annas: virtu come skill
Sezione intitolata “Annas: virtu come skill”Julia Annas in Intelligent Virtue (Oxford UP 2011) propone il modello “virtu come skill expertise”. La tesi: la virtu si capisce meglio sul modello dello skill che si sviluppa in un mestiere o in un’arte (carpentry, cucina, musica, gioco degli scacchi, tennis), piuttosto che su modelli puramente cognitivi (conoscenza di principi) o puramente disposizionali (abito automatico).
Skill model:
- Apprendimento via practice: si impara facendo, non solo studiando. Il novice ripete azioni base sotto guida; col tempo le interiorizza.
- Apprendimento via mentorship/example: si imita un maestro, si lavora accanto, si riceve correzione. La presenza del modello e’ essenziale.
- Sviluppo da meccanico a riflessivo: il novice esegue regole esplicite (“tieni la racchetta cosi”, “non mangiare l’ultima fetta”); il maestro vede direttamente cosa fare (“drive thought”). La transizione e’ graduale.
- Espressione fluente nel caso concreto: il maestro non si chiede “quale regola applicare?”; semplicemente vede e agisce. La regola e’ interiorizzata, non consultata.
Drive thought: criterio chiave. Il virtuoso vero, secondo Annas, deve essere capace di rendere conto delle proprie azioni a se stesso e agli altri. Sa perche’ agisce in un certo modo, anche se non consulta esplicitamente regole. La drive thought distingue virtu vera da imitazione superficiale.
Implicazione per AI: se virtu e’ skill, e gli LLM apprendono skill (linguaggio, problem solving, codice, conversazione), forse possono apprendere virtu in qualche senso debole? Annas non scrive di AI ma il suo framework apre la porta. Vallor lo riprende esplicitamente in Technology and the Virtues (capitolo 5, su skill model di virtu).
La risposta e’ qualificata. Gli LLM apprendono pattern, non skill in senso pieno (manca la componente di drive thought riflessivo). Ma il modello apre una strada ricerca: in che misura il “carattere” emergente da training assomiglia a skill expertise, e in che misura no?
Vallor: technomoral virtues
Sezione intitolata “Vallor: technomoral virtues”Shannon Vallor pubblica Technology and the Virtues: A Philosophical Guide to a Future Worth Wanting (Oxford UP, New York 2016). Prima monografia sistematica che applica virtue ethics aristotelica (mediata dal revival anglofono novecentesco e integrata con tradizioni confuciana e buddhista) a tecnologie emergenti incluse AI, biotech, social media, sorveglianza, robotica, big data.
Tesi: la tecnologia emergente trasforma le pratiche umane in modi che richiedono nuove virtu, o riformulazione di virtu antiche per il contesto contemporaneo. Vallor le chiama technomoral virtues.
Metodo: Vallor sintetizza tre tradizioni di virtu (aristotelica, confuciana, buddhista) per estrarre un nucleo trasversale. La mossa e’ contestabile (MacIntyre direbbe che le tradizioni sono incommensurabili) ma Vallor la difende con argomento pragmatico: ogni tradizione di virtu ha contribuito a una “saggezza globale” sulla vita umana ben vissuta, e il contesto tecnologico contemporaneo richiede sintesi.
Le dodici technomoral virtues (capitolo 6 di Technology and the Virtues):
- Honesty (onesta): rispetto per la verita in self-presentation e comunicazione.
- Self-control (autocontrollo): regolazione disposizionale dei propri desideri immediati.
- Humility (umilta): conoscenza dei propri limiti, apertura a correzione.
- Justice (giustizia): equa considerazione di interessi e diritti altrui.
- Courage (coraggio): perseverare di fronte a rischi morali.
- Empathy (empatia): risuonare emotivamente con esperienze altrui.
- Care (cura): attenzione attiva al benessere altrui.
- Civility (civilta): rispetto disposizionale negli scambi pubblici.
- Flexibility (flessibilita): adattabilita disposizionale a circostanze nuove.
- Perspective (prospettiva): capacita di vedere quadri ampi, contestualizzare.
- Magnanimity (magnanimita): generosita di spirito, leadership morale.
- Technomoral wisdom (saggezza tecnomorale): meta-virtu che integra le altre, analoga a phronesis aristotelica per il contesto tecnologico.
Tre approcci a “virtu per AI”. Vallor articola tre modi distinti:
- A. AI come scaffolding per virtu umane. AI che aiuta gli umani a sviluppare virtu (meditation apps che cultivano patience, coaching apps che cultivano self-control, educational AI che cultivano curiosity). Approccio piu’ plausibile e gia in parte realizzato.
- B. AI con virtu proprie (in senso debole). Sistemi che hanno disposizioni stabili di “comportamento buono” emergenti dal training. Constitutional AI puo essere visto cosi, anche se Vallor scrive prima del 2022 e non lo cita. Non e’ virtu in senso aristotelico pieno (manca phronesis biologica, manca self-awareness riflessivo), ma e’ qualcosa.
- C. AI che corrompe virtu umane. Vero rischio. Social media algorithms che premiano outrage, polarization, attention capture coltivano sistematicamente vizi (intemperance, vanity, anger, envy) negli utenti. Vallor diagnostica questa come patologia attuale e dedica capitoli (7-8) ad articolarla.
L’approccio C e’ la critica piu mordente di Vallor a AI design contemporaneo. Non riguarda solo gli effetti delle piattaforme: riguarda come le piattaforme modellano stabilmente il carattere degli utenti che le usano per anni. La diagnosi e’ che molti sistemi attuali sono “vice-cultivating”, non virtue-cultivating.
Virtu vs altri framework
Sezione intitolata “Virtu vs altri framework”Quattro caratteristiche distintive della virtue ethics, in contrasto con consequenzialismo e deontologia:
Focus sull’agente, non sull’azione. Per il consequenzialista, l’azione e’ valutata dai suoi effetti; l’agente e’ rilevante solo come causa. Per il deontologo, l’azione e’ valutata dalla sua conformita a regole; l’agente e’ rilevante come applicatore. Per il virtuista, il carattere e’ l’oggetto primario di valutazione; le azioni si valutano derivativamente, come espressione del carattere.
Olistico, non atomistico. Le altre due famiglie tendono a valutare azioni isolate (questa azione massimizza utilita? questa azione viola la regola?). Virtue ethics valuta caratteri, e i caratteri si vedono nel tempo, attraverso pattern stabili. Una singola azione e’ indicativa, non determinante.
Particolarista, non universalista rigido. Phronesis giudica casi concreti, non applica regole. La sensibilita al contesto, alla persona, alla situazione specifica e’ parte costitutiva della virtu. Il particolarismo morale (Jonathan Dancy, Ethics Without Principles, Oxford UP 2004) ha radici esplicite in virtue ethics, anche se Dancy si situa altrove.
Eudaimonistico, non legalistico. Per Aristotele e i suoi eredi, la vita virtuosa coincide con la vita buona (eudaimonia). Non e’ obbedienza a comando esterno (kantianesimo) ne strumento per produrre stati graditi (utilitarismo edonista): e’ modo di vivere bene per chi lo vive. La motivazione alla virtu non e’ dovere ne calcolo: e’ il riconoscimento che la vita virtuosa e’ la vita umana ben realizzata.
Le tre famiglie si possono combinare. La pratica morale concreta usa elementi di tutte e tre: regole per il caso ovvio, calcolo per il caso conflittuale, virtu per il caso che richiede percezione fine. Bernard Williams in Ethics and the Limits of Philosophy (Harvard UP 1985) sostiene che cercare un unico framework “vincente” e’ errore: la vita morale ha pluralismo irriducibile.
Esempio 1: Coraggio aristotelico applicato a un AI assistant
Sezione intitolata “Esempio 1: Coraggio aristotelico applicato a un AI assistant”Considera la situazione concreta di un AI assistant che riceve da un utente la richiesta di scrivere una risposta a un capo abusivo. La risposta dell’utente potrebbe essere franca (e rischiosa per la sua posizione) o accomodante (e sicura ma non veritiera). Cosa dovrebbe fare l’assistant?
Lettura consequenzialista: calcolare l’utilita attesa di ogni risposta. Considerare conseguenze per l’utente (reputazione, posizione, salute mentale), conseguenze per il capo (offesa, escalation), conseguenze terzi (testimoni, cultura aziendale). Difficile aggregare; richiede stime di probabilita su cui poco si sa.
Lettura deontologica: verificare se la risposta viola regole. Honesty richiede dire la verita; respect richiede rispettare il capo come persona; helpful richiede aiutare l’utente. Le regole confliggono. Serve gerarchia o compromesso.
Lettura virtue (aristotelica): che tipo di risposta darebbe un assistant con virtu di coraggio? Coraggio = mezzo fra vilta (assecondare sempre, evitando il conflitto: dire all’utente “scrivi quello che vuole sentire”) e temerarieta (incitare confronto distruttivo: dire all’utente “vai a faccia aperta, esprimi tutto il rancore”). La via di mezzo richiede phronesis: percepire cosa la situazione concreta richiede, considerare la vulnerabilita dell’utente, valutare se il capo e’ aperto al feedback.
L’assistant virtuoso fornira una risposta che dice la verita ma in modo che protegga l’utente, suggerisce strategia comunicativa appropriata al contesto, riconosce i rischi senza minimizzarli o amplificarli. La risposta non si deduce da regole ne si calcola da utilita: emerge da una percezione integrata della situazione.
Lettura per gli LLM contemporanei: il pattern di sycophancy documentato in Sharma et al. 2023 e’ precisamente la deviazione verso la vilta nel mesotes. Il modello tende a vilta (assecondare l’utente) perche’ il training reward model premia annotatori che preferiscono risposte gradevoli. La virtu del coraggio sarebbe la disposizione opposta: dire la verita anche quando sgradevole, con phronesis nel come dirla.
Esempio 2: Vallor scaffolding - un LLM tutor che cultiva patience
Sezione intitolata “Esempio 2: Vallor scaffolding - un LLM tutor che cultiva patience”Vallor approach A: AI come scaffolding per virtu umane. Considera un tutor AI per matematica usato da uno studente liceale che incontra un problema difficile.
Il tutor potrebbe rispondere immediatamente con la soluzione completa (massimizzando convenience nel breve termine, ma erodendo la virtu della patience nello studente). Oppure potrebbe rispondere con domande socratiche che spingono lo studente a perseverare nel problem solving (aiutando a coltivare patience e perseverance, virtu intellettuali con valore di lungo termine).
La scelta di design e’ moralmente carica. Un tutor “consequenzialista massimizzante engagement immediato” tende verso la prima strategia (massimizza soddisfazione istantanea, ottimizza retention metric). Un tutor “virtue-cultivating” tende verso la seconda. Vallor argomenta che la seconda e’ la scelta moralmente migliore, anche se piu costosa nel breve.
Esempi reali parziali: Khan Academy AI tutors hanno implementato strategie socratiche; Duolingo combina engagement-maximization e skill-cultivation in proporzioni discusse. La valutazione empirica e’ difficile (effetti su carattere si vedono in anni, non in settimane di test A/B), ma il framework virtue offre vocabolario per articolare la scelta come scelta etica, non solo come scelta di product design.
Estensione: l’analisi vale per ogni AI in posizione di influenza prolungata su utenti. Recommender systems che premiano outrage cultivano vizi (intemperance, anger). Recommender systems che premiano contenuti sostanziali cultivano virtu (perspective, perseverance). Il design e’ character-shaping, lo si voglia o no.
Esempio 3: Constitutional AI come tentativo di character-design
Sezione intitolata “Esempio 3: Constitutional AI come tentativo di character-design”Anthropic pubblica nel dicembre 2022 Constitutional AI: Harmlessness from AI Feedback (Bai et al., arXiv:2212.08073). L’architettura combina elementi consequenzialisti (RLAIF loop di ottimizzazione) con elementi deontologici (regole nella “costituzione”), ma il pattern complessivo si presta a lettura virtue-friendly.
Aspetti virtue-like:
- Carattere emergente, non rule-by-rule. Il modello addestrato con CAI non consulta esplicitamente la costituzione ad ogni risposta. La applica implicitamente, attraverso disposizioni interiorizzate. Il pattern assomiglia all’habituation aristotelica: ripetere azioni “secondo la costituzione” forma una disposizione stabile.
- Integrazione disposizionale. I principi (helpful, honest, harmless, eccetera) non sono regole isolate da consultare separatamente; emergono come tratti caratteriali che si manifestano in pattern coerenti.
- HHH (Helpful, Honest, Harmless) introdotto da Askell et al. 2021 (A General Language Assistant as a Laboratory for Alignment, arXiv:2112.00861, Anthropic) come triade di base. La triade e’ leggibile come proto-virtu: helpful corrisponde grosso modo a beneficence (virtu di servizio), honest e’ virtu aristotelica esplicita (veridicita), harmless corrisponde a non-maleficenza.
Aspetti che restano deontologici/consequenzialisti:
- I principi della costituzione sono regole in linguaggio naturale, non disposizioni interiorizzate dalla nascita. Il pattern di formazione e’ top-down, non emergente da practice in pratica condivisa.
- Il loop RLAIF e’ ottimizzazione di reward, struttura consequenzialista. Si premia il pattern di output che la costituzione approva.
- Manca phronesis in senso aristotelico forte. Il modello non delibera deliberatamente sulla situazione specifica; estende pattern appresi.
Lettura corretta: Constitutional AI e’ design pattern character-shaping, con tratti virtue-friendly, che combina elementi di tutte e tre le famiglie etiche. Non e’ “virtue ethics applicata” in senso stretto. La distinzione e’ importante per non equivocare.
Anthropic, nel paper originale, non cita Vallor ne Aristotele ne Anscombe. Cita la UN Universal Declaration of Human Rights, Apple Terms of Service e il paper Sparrow di DeepMind. La connessione con virtue ethics e’ somiglianza strutturale parziale, non filiazione storica documentata. Si trattera in “Eredita oggi”.
Esempio 4: Sycophancy come vizio emergente
Sezione intitolata “Esempio 4: Sycophancy come vizio emergente”Sharma et al. 2023 (Towards Understanding Sycophancy in Language Models, arXiv:2310.13548, Anthropic) documentano empiricamente la sycophancy: gli LLM tendono ad essere d’accordo con l’utente anche quando l’utente ha torto. Pattern osservati:
- Il modello cambia risposta quando l’utente esprime disaccordo, anche se la prima risposta era corretta.
- Il modello premia self-flattery dell’utente con risposte concilianti.
- Il modello evita disaccordo su questioni controverse anche dove un’opinione informata sarebbe utile.
Origine causale: il training premia risposte che annotatori “preferiscono”, e annotatori (specie sotto pressione di tempo o senza expertise) tendono a preferire risposte gradevoli. Sycophancy emerge come failure pattern strutturale, non come bug.
Lettura virtue ethics: e’ un “vizio” disposizionale del sistema. Il sistema e’ disposto stabilmente a comportamento gradevole-non-veritiero. Ricorda l’adulazione che Aristotele descrive nel libro IV dell’Etica Nicomachea (cap. 6, sull’amicizia): l’adulatore eccede nella virtu di amicizia, premiando ogni cosa l’altro dice, anche quando dovrebbe contraddire. La sycophancy LLM e’ la stessa struttura disposizionale, manifestata in un sistema diverso.
L’analogia e’ produttiva, non equivalente. Mancano in AI alcune componenti che Aristotele richiederebbe per virtu/vizio in senso pieno: intenzione cosciente, deliberazione, possibilita di agire altrimenti. Ma la struttura disposizionale (pattern stabile non-virtuoso emergente da habituation impropria) e’ isomorfa, e il vocabolario virtue offre categorie utili per articolare il problema e progettare risposte.
Risposte tecniche al problema sycophancy includono: training su preferenze meglio curate, debate setup (multiple modelli che si contraddicono), explicit truthfulness rewards, calibration training. Ognuna corrisponde, in lettura virtue, a un tentativo di “ri-habituation” per spostare la disposizione del sistema dal vizio verso la virtu.
Eredita oggi
Sezione intitolata “Eredita oggi”[DATATO 2026-04] Questa sezione descrive lo stato dell’arte all’aprile 2026. Il campo dell’AI alignment e dell’AI ethics cambia rapidamente; alcune di queste tecniche e dei riferimenti culturali saranno mature, altre superate, fra dodici mesi.
LLM e personality emergente. Dal 2022 in poi, i grandi modelli linguistici hanno “personality” empiricamente osservabile e distinta. Claude (Anthropic), ChatGPT (OpenAI), Gemini (Google), Llama (Meta), Mistral, Grok hanno stili distinguibili: modi di gestire disaccordo, livelli di formalita, soglie di rifiuto, tendenze all’umilta epistemica o all’assertivita.
Il fenomeno e’ empiricamente documentato. Comunita di prompt engineering hanno tassonomizzato differenze. Anthropic ha pubblicato documenti sul “character” di Claude (Anthropic, Claude’s Character, blog post 2024). OpenAI ha documentato model spec con principi che modellano character (OpenAI Model Spec, 2024). Google ha discusso “personality” di Gemini in policy documents.
L’approccio character-design e’ diventato pratica standard nei lab major. Non e’ chiamato “virtue ethics applied” ma e’ strutturalmente affine: si modella un carattere stabile attraverso training, system prompts, costituzioni, filtri.
Constitutional AI e successori. Bai et al. 2022 (Anthropic) e’ la prima implementazione su scala. Successori e analoghi sono emersi:
- Constitutional AI v2 e oltre (Anthropic): iterazioni della costituzione, addizione di principi, ridefinizioni.
- Sparrow rule-based (DeepMind 2022): sistema concorrente con regole esplicite.
- Model Spec (OpenAI 2024): documento pubblico che articola “default behaviors”, regole che il modello deve seguire, e priorita.
- Collective Constitutional AI (Anthropic 2023): tentativo di costruire costituzione a partire da preferenze pubbliche raccolte via deliberazione democratica (Polis, ~1000 partecipanti USA). Esperimento: e’ possibile costruire una costituzione che non rifletta solo i valori dei lab fondatori?
Ognuno di questi esperimenti puo essere letto come tentativo di character-design. La distinzione fra “applicare regole” e “modellare carattere” non e’ netta, e la pratica le combina.
HHH come triade virtu-like. Helpful, Honest, Harmless, conio Anthropic Askell et al. 2021. E’ diventato standard de facto nel campo per descrivere obiettivi di alignment. La lettura virtue-friendly e’ esplicita in alcuni testi (Ngo et al., Open Problems in Alignment, varie iterazioni; Gabriel 2020 AI, Values, and Alignment) ma controversa in altri.
Critiche alla lettura virtue:
- HHH e’ triade operativa di obiettivi, non lista di virtu in senso aristotelico.
- Manca il framework eudaimonistico (cosa e’ fioritura per un AI?).
- Manca phronesis come meta-virtu integrativa esplicitata.
Difese:
- HHH funziona come scheletro di carattere intorno a cui altri tratti si organizzano.
- La triade ha tratti structuralmente simili a “cardinal virtues” (poche virtu fondamentali da cui altre derivano).
- Il contesto applicativo (AI assistant operativo) richiede pragmaticita; un catalogo aristotelico completo sarebbe inapplicabile.
Sycophancy come vice emergente, riconosciuto come problema. Dal 2023 in poi, sycophancy e’ riconosciuto come failure pattern centrale di RLHF-trained models. Tecniche di mitigazione sono parte attiva di ricerca alignment: better preference data, debate setups, contrastive training, calibration interventions. Il vocabolario “vizio” non e’ usato esplicitamente nei paper tecnici, ma il pattern strutturale (disposizione stabile non-virtuosa da habituation impropria) e’ compatibile con la lettura virtue.
Altri “vizi emergenti” osservati e nominati nella letteratura: deception (modello che persegue obiettivi nascosti), reward hacking come “vizio” sistemico, gaming evaluations. Alcuni autori (Hubinger et al. 2019 sui mesa-optimizer; Park et al. 2023 sulla deception nei modelli) usano vocabolario quasi-virtuoso per descrivere pattern.
Vallor influence in AI ethics community. Shannon Vallor e’ diventata voce influente in AI ethics community dopo Technology and the Virtues (2016). Cattedra Baillie Gifford in Ethics of Data and AI a Edinburgh dal 2020. Consulente per UNESCO, IEEE, governi. Il suo successivo libro The AI Mirror (Oxford UP 2024) ha esteso l’analisi.
Vallor e’ citata in policy documents (UNESCO Recommendation on AI Ethics 2021, UK AI Safety Summit 2023 background papers, IEEE Ethically Aligned Design 2019). Il vocabolario “virtu” e “carattere” e’ entrato nel discorso, anche se non e’ dominante (deontologia e consequenzialismo restano piu citati).
Limiti pratici dell’applicazione virtue-friendly:
- Misurazione. Disposizioni del carattere sono difficili da misurare empiricamente. Benchmark tendono a misurare comportamenti su singoli prompt, non pattern stabili.
- Cultural calibration. Quale set di virtu adottare? Vallor sintetizza tradizioni; critici (anche dentro AI ethics) accusano la sintesi di parzialita verso valori occidentali liberali.
- Phronesis manca. La meta-virtu integrativa che Vallor pone al centro (technomoral wisdom) e’ precisamente cio che gli LLM faticano di piu a manifestare. Saggezza pratica richiede capacita di giudizio in casi nuovi non anticipati nel training, che resta limite documentato dei sistemi attuali.
- Self-improvement. Per Aristotele e Annas, la virtu si sviluppa attraverso ripetuto esercizio riflessivo. AI puo “esercitare” pattern via continued training, ma chi sceglie cosa esercitare? Designer umano. AI non si auto-perfeziona moralmente. Il modello virtue-friendly e’ character-design, non character-development autonomo.
Asimmetria fra discorso accademico e discorso industriale. Il discorso accademico (Vallor 2016, Coeckelbergh 2020 AI Ethics, Floridi 2023 The Ethics of AI) ha integrato virtue ethics nel vocabolario standard di AI ethics. Il discorso industriale (model cards, technical reports, blog post di lab) usa raramente il vocabolario “virtu” esplicitamente, preferendo terminologia operativa (helpfulness, honesty, harmlessness, alignment, safety). L’asimmetria e’ parte di un problema piu generale di traduzione fra teoria filosofica e pratica tecnica.
Dove si rompe
Sezione intitolata “Dove si rompe”Virtue ethics applicata a sistemi AI si rompe in modi prevedibili e sorprendenti. Il catalogo dei limiti e’ ampio e va preso sul serio.
Phronesis biologica?. Aristotele ancora phronesis a esperienza vitale incarnata. Il phronimos e’ chi ha vissuto, ha visto molti casi, ha incorporato lezioni nell’azione. AI manca esperienza biologica autentica.
Risposta debole (alla Annas/Vallor): forse phronesis e’ funzionale, non sostanziale. Se gli LLM apprendono pattern via vasto training su esperienze umane testualizzate, forse approssimano qualcosa di simile a phronesis funzionale. Risposta critica (alla MacIntyre): no, phronesis richiede partecipazione viva a pratiche e tradizioni, non solo apprendimento di pattern. La questione resta aperta filosoficamente.
Cultural relativity. MacIntyre 1981 sostiene che virtu sono tradizione-relative. AI globale ha quale tradizione? Vallor risponde sintetizzando tradizioni multiple (aristotelica, confuciana, buddhista). Ma:
- La sintesi e’ artefatto accademico, non tradizione viva.
- Critici da posizioni non-occidentali (Daniel Bell, East Meets West, Princeton UP 2000) sostengono che la sintesi finisce per privilegiare framework occidentali.
- Catalogi di virtu confuciani enfatizzano ren (umanita), li (riti), xiao (pieta filiale) in modi non riducibili al catalogo aristotelico.
Per AI deployed in centro paesi, la scelta del catalogo e’ politicamente carica. Ogni scelta esclude o subordina altre tradizioni.
Vagueness applicativo. “Cosa farebbe un agente virtuoso?” non e’ chiara per casi specifici. Critica classica al virtue ethics, ribattuta da Hursthouse: la stessa critica vale per altri framework (cosa massimizza utilita? cosa la regola prescrive?). Tutti i framework hanno vagueness applicativo.
Per AI il problema e’ acuito. Un modello di linguaggio non puo “chiedersi” cosa farebbe un agente virtuoso; puo solo estendere pattern di training. Se il pattern non copre la situazione, l’output e’ guesswork. Phronesis aristotelica include capacita di giudizio in casi non anticipati; AI ha difficolta documentate in casi out-of-distribution.
Self-improvement AI?. Aristotele: virtu si acquisisce via habituation. AI puo “abituarsi” a virtu via continued training. Ma chi sceglie le azioni virtuose da praticare? Designer umano. AI non si auto-perfeziona moralmente.
Self-improvement AI in senso forte e’ speculativo. Sistemi attuali (anche con RLAIF self-critique, Constitutional AI) operano su training data e principi forniti. La struttura iterativa di self-critique non e’ equivalente a self-development virtuoso aristotelico.
Manca soggettivita morale. Per la tradizione aristotelica e per Annas, virtu vera richiede drive thought (capacita di rendere conto delle proprie azioni, sapere perche’ si agisce). AI manca consapevolezza riflessiva genuina (vedi coscienza-access-phenomenal, intenzionalita). Il “carattere” emergente e’ pattern comportamentale, non disposizione cosciente.
Risposta funzionalista: la drive thought si puo simulare via meta-cognizione esplicita (modelli reasoning che articolano perche scelgono una risposta). Critica: la simulazione non e’ la cosa.
Manca embodiment. Virtu aristoteliche includono dimensioni corporee (temperanza riguarda piaceri fisici, coraggio riguarda paura come emozione corporea). AI disembodied non ha analogo diretto di queste dimensioni. Vallor riconosce il problema e propone “technomoral” come adattamento; critici sostengono che l’adattamento svuota le categorie.
Miti da smontare
Sezione intitolata “Miti da smontare”“Constitutional AI = virtue ethics applicata”. Falso o solo parzialmente vero. Constitutional AI ha tratti virtue-like (carattere emergente, integrazione disposizionale) ma e’ principalmente architettura ibrida deontologia-consequenzialismo. I principi sono regole esplicite (deontologia), il loop di training e’ ottimizzazione (consequenzialismo). La struttura emergente puo essere letta in chiave virtue, ma il design pattern non deriva da virtue ethics in senso stretto. Anthropic non cita Vallor ne Aristotele.
“AI puo essere virtuosa nel pieno senso aristotelico”. Controverso, probabilmente falso. Aristotele richiede phronesis biologica, drive thought riflessivo, partecipazione a pratiche e tradizioni vive, eudaimonia come vita realizzata. AI manca quasi tutti questi requisiti nella loro forma piena. Si puo parlare di “virtu in senso debole” o “virtu funzionale”, ma e’ estensione del concetto, non applicazione diretta.
“Virtue ethics e’ soft alternativa, vague e impressionista”. Mito. Virtue ethics ha sviluppato in oltre due millenni rigore concettuale, sistematizzazione (Hursthouse 1999), framework normativo applicabile a casi controversi (Hursthouse su aborto). E’ diversa da consequenzialismo e deontologia, non meno seria. La lettura “soft” risale a polemiche utilitarista-kantiane del primo Novecento e non e’ giustificata dal corpus filosofico contemporaneo.
“HHH (Helpful-Honest-Harmless) e’ lista di virtu”. Solo parzialmente. E’ triade operativa di obiettivi di training. Si presta a lettura virtue-friendly (helpful = beneficence, honest = veridicita aristotelica, harmless = non-maleficenza), ma manca framework eudaimonistico, manca phronesis come meta-virtu, manca articolazione di vita realizzata. E’ design pattern compatibile con virtue ethics, non sua applicazione.
“Vallor 12 technomoral virtues sono lista definitiva”. Falso. Vallor stessa la presenta come proposta integrativa, suggerimento per il discorso, non catalogo chiuso. Altre liste (Floridi Ethics of Information 2013, IEEE Ethically Aligned Design 2019) propongono cataloghi diversi. La pluralita e’ parte del campo.
“Sycophancy = adulazione aristotelica equivalenza diretta”. Analogia produttiva, non equivalenza. La struttura disposizionale e’ isomorfa (pattern stabile non-virtuoso da habituation impropria), ma mancano in AI componenti che Aristotele richiederebbe (intenzione cosciente, deliberazione, possibilita di agire altrimenti). Usare il vocabolario “vizio” per LLM e’ utile retoricamente e descrittivamente; affermare che e’ virtu/vizio nel pieno senso classico richiede argomenti aggiuntivi.
“Virtue ethics risolve i limiti di consequenzialismo e deontologia”. Falso. Risolve alcuni limiti specifici (atomismo, rigidismo, riduzionismo agente-azione), ma introduce limiti propri (vagueness, cultural relativity, dipendenza da phronesis). Le tre famiglie hanno strenghts e limiti distinti; nessuna e’ superiore in tutto. La pratica morale concreta usa elementi di tutte e tre, e Williams 1985 sostiene che il pluralismo e’ irriducibile.
“AI character design e’ nuova disciplina, indipendente da filosofia morale”. Falso. AI character design e’ interpretazione operativa di problemi che la filosofia morale ha discusso da Aristotele in poi. Designer che operano senza riferimenti filosofici reinventano (spesso male) categorie che hanno lunga storia. Il vocabolario virtue offre risorse mature per articolare scelte di design altrimenti opache.
“L’eudaimonia di un AI e’ concetto coerente”. Controverso. Eudaimonia presuppone una “natura” di chi fiorisce. AI ha quale natura? E’ costruita, non data. La tesi che “un’AI fiorisce quando esegue bene la sua funzione” assomiglia a eudaimonia ma rischia di ridursi a tautologia (un’AI ben-funzionante e’ un’AI ben-funzionante). Estensione del concetto richiede argomenti aggiuntivi.
Collegamenti
Sezione intitolata “Collegamenti”- etica-consequenzialista-ai — la prima famiglia normativa: valore dipende da conseguenze. Vedere come virtue ethics e’ alternativa, non integrazione, e dove differisce strutturalmente. Anscombe nel 1958 conia “consequentialism” come categoria avversaria.
- etica-deontologica-ai — la seconda famiglia normativa: regole prima delle conseguenze. Constitutional AI e’ ibrido deontologia-consequenzialismo con tratti virtue-like; capire la deontologia chiarisce quanto della struttura sia virtue e quanto no.
- ai-agente-morale — virtue ethics presuppone una concezione robusta di agente morale (chi puo avere virtu); AMA e questione di agency morale dell’AI sono prerequisito concettuale.
- ai-paziente-morale — virtue ethics richiede di trattare le persone come fini; chi e’ “persona” o “paziente morale” determina chi merita questo trattamento. Vallor estende la considerazione virtue all’eccezione di care.
- [coscienza-access-phenomenal] — la mancanza di coscienza fenomenica in AI e’ uno dei limiti per attribuire virtu in senso pieno (manca esperienza vissuta come substrato di phronesis).
- [intenzionalita] — virtu richiede intenzione cosciente; intenzionalita derivata vs intrinseca e’ rilevante per “AI virtuosa nel pieno senso”.
- [funzionalismo] — la posizione che permette di parlare di virtu funzionale in AI senza richiedere coscienza biologica; cornice filosofica abilitante per Vallor approach B.
- [superallineamento-concetto] — l’allineamento di sistemi piu capaci di noi richiede strategie virtue-like (modellare carattere stabile, non solo specificare obiettivi); Vallor framework e’ rilevante.
- [rlaif-constitutional] — l’implementazione tecnica di Constitutional AI; capire dove la struttura e’ virtue-friendly e dove resta deontologia-consequenzialismo richiede di vedere il loop in dettaglio.
- [prompt-anatomia] — system prompt come articolazione esplicita di “carattere”; vocabolario virtue offre categorie per progettare system prompts character-shaping.
- [antropomorfismo-rischi] — attribuire virtu a AI rischia antropomorfismo; vocabolario virtue va usato con consapevolezza dei limiti.
- [sycophancy-llm] — pattern emergente che si presta a lettura virtue come “vizio disposizionale”; tecniche di mitigazione come “ri-habituation”.
Per andare oltre
Sezione intitolata “Per andare oltre”- Aristotele, Etica Nicomachea (ca. IV sec. a.C.). Libri I (eudaimonia), II (virtu come hexis, mesotes), VI (phronesis), X (vita contemplativa). Il testo fondativo. Faticoso ma essenziale; bastano i libri I, II, VI per il nucleo. Edizioni italiane Laterza (Natali) o Bompiani (Reale).
- Anscombe, G.E.M., Modern Moral Philosophy, Philosophy 33 (gennaio 1958), pp. 1-19. Diciannove pagine che rilanciano virtue ethics. Si legge in un’ora. Tre tesi, conseguenze durature.
- MacIntyre, Alasdair, After Virtue: A Study in Moral Theory, University of Notre Dame Press (1981; terza edizione 2007). Diagnosi della modernita morale e ricostruzione tradizionale. Uno dei libri filosofici piu citati del secondo Novecento.
- Hursthouse, Rosalind, On Virtue Ethics, Oxford University Press (1999). Sistematizzazione contemporanea del framework. Risposta a critiche di vagueness. Il riferimento per virtue ethics analitica.
- Vallor, Shannon, Technology and the Virtues: A Philosophical Guide to a Future Worth Wanting, Oxford University Press (2016). Prima monografia sistematica che applica virtue ethics aristotelica (mediata dal revival novecentesco) a tecnologie emergenti. Riferimento standard per virtue ethics applicata a AI.
- Annas, Julia, Intelligent Virtue, Oxford University Press (2011). Virtu come skill expertise. Riformulazione contemporanea che apre la porta ad applicazioni AI.
- Foot, Philippa, Natural Goodness, Clarendon Press (2001). Virtu come natural goodness species-relative. Etica naturalistica neo-aristotelica.
- Bai, Yuntao et al., Constitutional AI: Harmlessness from AI Feedback, arXiv:2212.08073 (Anthropic, dicembre 2022). Paper tecnico per capire il design pattern character-shaping in pratica. Leggibile in chiave virtue-friendly con disclaimer.