Einführung in die Rechnerarchitektur

#era
#orga
Workflow:

Vorlesung/Moodle -> reine Gliederung (Obsidian)
Bjarne(the goat)-Slides -> Handnotizen
ZÜ-Quizzes
Handnotizen, Bjarne-Tipps -> Obsidian
Tutoriumsaufgaben/Altklausur

1. Einführung und Datenrepräsentation Datei

Datendarstellungen

Grundlage: Relais (Stromkreis durch separaten Strom an/aus öffnen schließen)
Transistor (selbe Funktionsweise, aber nur 3 Kontakte also 1 Stromkreis)

Binär

"Word" = Basisgröße des Systems (16 bit, 32 bit, etc.)
- wir benutzen 32 bit
Negative Zahlen via Zweierkomplement (Rechnung leichter)
- Invertierung, + 1
- Wertebereich $[2^{n - 1}, 2^{n - 1} - 1]$ -> positiver Bereich eins kleiner, dafür $0$ dabei
Kommazahlen via
- Tupel aus 2 Zahlen (vor und nach Komma)
- Floating Point Numbers
  - S: Vorzeichen
  - F: Nachkommastellen nach 1 (Fraction, Koeffizient, Mantisse, Significant)
  - E: Verschiebung des Kommas (Abzüglich Bias)
  - ( $M a n t i s s e \cdot b a s i s^{E x p o n e n t}$ )
Strings via Ascii (so 8 bit Zahl <-> Buchstabe halt)
- C-String
  - endet mit dem Byte 0x0 (null-terminiert)
  - in RV-Assembly mit .asciz
  - Soweit ich weiß bei uns eher default
- Pascal String
  - beginnt mit Zahl als Länge
  - "Der Pascal sagt dir gleich was Sache ist"

Abstraktionsebenen

Vorteil: Verschiedene Versionen jeder Ebene mit jeweils anderen Ebenen kompatibel

%%{init: {
  'theme': 'base', 
  'themeVariables': { 
    'canvasBkgd': '#221c19',
    'mainBkg': '#3d4b5c',
    'primaryColor': '#3d4b5c',
    'primaryTextColor': '#e0e0e0',
    'lineColor': '#6b7a8d',
    'clusterBkg': 'transparent',
    'clusterBorder': 'transparent'
  }
}}%%
graph TD
    accTitle: ERA Schichtenmodell - Pfad-Korrektur
    accDescr: Darstellung der Übersetzungswege von Source/Skript über VM und Assembler zur ISA

    %% Software Schichten
    SC[Source Code]
    SK[Skript]
    IVM[Interpreter / VM]
    AS[Assembler]

    ISA[ISA - Instruction Set Architecture]

    %% Hardware Schichten
    BR[Binär Repräsentierung]
    VN[Von-Neumann-Schicht]
    MA[Mikroarchitektur-Schicht]
    GS[Gatter-Schicht]
    BS[Bauelemente-Schicht]
    PS[Physikalische Schicht]

    %% Spezifische Pfade aus deiner Grafik
    SC --> AS
    SC --> IVM
    SK --> IVM
    IVM --> AS
    
    %% Übergang zur Hardware
    AS --- ISA
    ISA --- BR
    BR --- VN
    VN --- MA
    MA --- GS
    GS --- BS
    BS --- PS

    %% Styling
    classDef default fill:#3d4b5c,stroke:#5c6d82,stroke-width:1px,color:#e0e0e0,font-weight:bold
    
    %% ISA Highlight bleibt zur Orientierung
    classDef isaClass fill:#1a5fb4,stroke:#fff,stroke-width:2px,color:#fff,font-weight:bold
    class ISA isaClass

2. Assemblersprachen Allgemein

C-Kompilierung

gcc - C Code -> Kompilierung auf ausführbare Binärdatei
-s: Erzeugt Zwischenergebnis (Assemblersprache)
hexdump - Inhalt der Binärdatei in Hex ausgeben
objdump
-h: teilt in sections ein
-d: Disassemblierung (Binär -> Assemblersprache)
-S: Codiertes Programm mit Bezug auf Quellcode

ISA

Instruction Set Architectures
Assemblersprache, Datenkodierungen, Systemeigenschaften, Boot-Up-Prozess

Komplexität

	CISC	RISC
Vorteil	einfach programmierbar	effiziente, schnelle Implementierung
Nachteil	langsame Implementierung, ungenutztes	schwer programmierbar
Format	variabel (mehrere Formate für selben Befehl)	einheitlich

2,5. RISC-V

Befehlsklassen

arithmetische und logische Operationen

Addition/Subtraktion

add/sub Ziel, Quelle1, Quelle2
addi Ziel Quelle1, Konst <- max 12 bits
lui lädt obere 20 bits (zusammen mit addi laden von 32 bits)

Multiplikation/Division (nur mit `M`-Erweiterung)

mul multipliziert untere 32 bit
mulh multiply high (multipliziert obere) signed * signed
...su signed * unsigned
...u unsigned * unsigned
div Division abgerundet
rem Rest
...u unsigned

Logische Operationen (bitwise)

and,or,xor
Für jeden Bit der beiden Zahlen

Schiebebefehle

Basically wie Multiplikation/Division, manchmal
sll shift left logical (um drittes argument, aber nur letzte 5 bits), füllt mit 0 auf
...i intermediate (direkt mit supplied 5 bit Zahl)
sr shift right... (zwei Möglichkeit)
...l logical (füllt mit 0 auf)
...a arithmetic (füllt mit 0 auf, aber behält aller ersten bit aka Vorzeichen)

Floating Point Arithmetik

Floats mit F-Erweiterung
Doubles mit D-Erweiterung
Eigene Register
fadd,fsub
...d

Datentransfer

Daten aus dem Hauptspeicher (Arbeitsspeicher) laden
ld load double word (64 bit)
sd store double word
ld destination const(Basisadresse)
Lädt in destination Adresse: Wert vonBasisadresse + const

Steuerung des Programmlaufs

Unbedingter Sprung

j offset Springe zu aktuell + offset
jr reg, const Springe zu Wert von reg + imm
Beim selbst Schreiben: Sprungmarken

Bedingter Sprung

bxx Operand1, Operand2, offset Springe um offset wenn Bedingung true
beq, bne, blt, bge
Andere Richtungen der letzten beiden via Tausch der Operanden

Unterprogramm

jal reg, offset Jump and link, Springe um offset, Speicher Adresse nächsten Befehls in reg

+Systembefehle ecall, Eskaliert vom
+Input/Output

Keine 1:1-Beziehung von Opcode und Befehl

Pseudobefehle, z.B.
mv rd, rs = add rd, rs, x0
j offset = jal x0, offset
li rd, i = 1.lui rd, i[31:12] 2.addi rd, rd, i[11:0]
-> Wenn i[11]=1, müssen wir lui rd,i[31:12]+1 machen, da addi das i[11:0] dann als negativ interpretiert und das Zweier-Komplement der Zahl vom Upper Immediate abzieht!

Speicher

Register

x0: zero
x1-x31:
an: Argument/Return
sn: saved (by callee)
tn: temporary
ra: return adress
sp: stack pointer (also callee-saved)

Hauptspeicher (Arbeitsspeicher)

Speicherzellen mit Größe entsprechend ISA
Byte-Adressiert (wir können nur ganze Bytes adressieren):

Adresse	Daten in Speicher
1 bit	1 byte = 8 bits

Data alignment

Ausrichtung auf n-Byte-Grenze: jede Adresse mod n = 0
Bei RISC-V ist der Stack 16 byte aligned

Endianness

Little Endian	Big Endian
least-significant Stelle ("kleines Ende") auf niedrigster Adresse	most-significant Stelle ("großes Ende") auf niedrigster Adresse
`0xABCD1234` im Speicher als \|34\|12\|CD\|AB\| (34 hat hier Wertigkeit $16^{1}$ / $16^{0}$ , die kleinste)	`0xABCD1234` im Speicher als \|AB\|CD\|12\|34\| (AB hat hier Wertigkeit $16^{7}$ / $16^{6}$ , die größte)
Erlaubt dynamische Größe (casting) des Werts ohne Verschieben des Pointers	Intuitiver für Menschen, um Zahlen im Speicher zu lesen
in RISC-V Wechselmöglichkeit, aber wir nutzen Little Endian

Aufbau

!era03-beispiel, p.12

Stack
- meist für Zwischenergebnisse verwendet
- meist kleiner als der Heap
- wächst meist nach unten (-> Erweitern durch Dekrementierung(!) des SP)
- recht einfach zu verwalten (LIFO)
- 16 byte aligned
Heap
- meist für dynamische Datenstrukturen verwendet
- meist größer als der Stack
- wächst meist nach oben
- schwerer zu verwalten (Dynamisch)
Static Data hat z.B. Konstanten wie verwendete Strings
Text ist der Programmcode

Jedes Programm erhält eigenen Adressraum (für genutzte Daten und Programm selbst)

Sign-Extension

Jede Zahl, die mit 1 beginnt (aka in Hex mit >=8 beginnt), ist im Zweier-Komplement negativ. Wenn wir diesen Zahlen mehr Stellen geben wollen ("größer casten"), gibt es eine wichtige Sache zu beachten: Der Default-Wert für "leere Stellen", die neu hinzukommen, ist bei negativen Zahlen nicht 0, sondern 1. Also füllt man mit 1en auf, wenn bspw. ein 12-bit Immediate auf ein 32-bit Register addiert werden soll.

`12 bits`	Sign-Extended auf `32 bits`
`0b 0100 0110 1110`	`0b 0000 0000 0000 0000 0000 0100 0110 1110`
`0b 1100 0110 1110`	`0b 1111 1111 1111 1111 1111 1100 0110 1110`

Calling Convention

Argumente/Return

Einzelnes Argument

Größe	Passed als
`<32 bits`	Sign-Extended auf `32 bits` -> 1 Register
`32 bits / 1 word`	1 Register
`64 bit / 2 words`	2 Register (lower half zuerst)
`>64 bit / >2 words`	Referenz

Argumente insgesamt

Größe	Passed in
`1-8 words`	Registern
`>8 words`	Stack

Return

Größe	Returned via
`32 bits / 1 word`	`a0`
`64 bit / 2 words`	`a0` und `a1`
`>64 bit / >2 words`	in `a0` referenzierter Adresse

zu "in a0 referenzierter Adresse"

Diese Adresse muss also der Caller der Funktion schon mitgeben.
Die tatsächlichen Argumente darf er dann erst ab a1 angeben.
Meist handelt es sich bei der Adresse in a0 um eine innerhalb des Stack-Frames des Callers, so weit Bjarne weiß sogar immer ganz oben (also bei 0(sp)).

Caller-/Callee-Saved

Caller-saved	Callee-saved
musst selber Wert speichern	aufgerufene Funktion darf Wert nicht verändern/muss ihn wiederherstellen

Aufbau Programm/Routine

Prologue
- Platz auf Stack reservieren (SP dekrementieren(!))
- Return Address und andere Variablen auf dem Stack sichern
Tatsächlicher Stuff
Epilogue
- Return Address etc. wieder vom Stack holen
- Platz auf Stack freigeben (SP inkrementieren(!))

3. Architekturen

Von-Neumann-Architektur

Struktur des Rechners unabhängig von bearbeitetem Problem
Rechner besteht aus vier Werken (die mit Bus-System verbunden sind):
Speicherwerk (RAM)
Leitwerk (CPU)
Rechenwerk (CPU)
Ein-/Ausgabewerk inkl. Sekundärspeicher (Peripherieanschluss, Festplatte)
Hauptspeicher hat Zellen gleiche Größe mit Adressen
Programm & Daten stehen in selbem Speicher und können durch die Maschine verändert werden
Die Maschine nutzt Binär
Programm besteht aus Folge von Befehlen
Von der Folge kann durch Sprünge abgewichen werden
Unterprogrammaufrufe:
1. Register sichern, Parameter supplien
2. Springen (Jump and Link)
3. Operation
4. Zurückspringen (Jump and Link)

Harvard-Architektur

Unterschied z.B.: Getrennter Speicher für Daten und Programm

inshallah das kommt in der klausur dran

4.A Andere ISAs

4.B Systemarchitektur

Mehrbenutzersysteme

Privilegienstufen

Machine Mode
- Babo Modus
- #Systemaufruf führt kurz hier hin, dann meist Mapping zu S-Mode
Supervisor Mode ("Kernel-Level")
- Hier landen wir meist nach #Systemaufruf
- Zugriff auf z.B. Hardware möglich
User Mode
- hier sind wir normalerweise
- mit #Systemaufruf können wir aber raus

Systemaufruf

in RISC-V mit ecall

Interrupts vs. Traps/Exceptions

Pasted image 20251104173149.png|500

shoutout an schulz's roten stift, you won't be missed

5. Speicherverwaltung & Caches

Virtueller Speicher (Paging/Mehrere Adressräume)

Jedes Programm hat eigenen Speicherraum mit virtuellen Adressen, und nur innerhalb dieses Adressraums Zugriff
Virtuelle Adresse wird immer auf physische übersetzt von MMU (früher Hardware) via Seiten-Kachel-Tabelle (auch mehrere Ebenen möglich)
4KiB Kacheln abgebildet auf 4KiB Kacheln (heutzutage auch größere möglich)
Nur Teil des Adressraums jedes Programms ist tatsächlich im Speicher angelegt, bei Bedarf wird erweitert
Was wenn Programm zugeschriebener Speicher nicht erfüllt werden kann weil keine Kacheln verfügbar? Freimachen beliebiger ( idealerweise lange ungenutzter) Kachel durch Auslagern auf Hintergrundspeicher/Festplatte

Herausforderungen und Einsatz von Virtuellem Speicher

Realisierung?
Naiv: 1 zusammenhängende Page Table mit komplettem Mapping
-> schneller Zugriff, aber giga Platzbedarf
man müsste ja 1 zusammenhängenden Platz für alle mappings aller Speicherräume reservieren
Based und Sigma: Ebenen mit Tables gemäß Teilen der Adresse
-> viel weniger Platzbedarf
-> aber auch langsamer
(weil nicht $1$ Zugriff sondern immer $n_{E b e n e n}$ Zugriffe)
-> Allerdings in der Praxis TLB (Cache für Mapping -> weniger Zugriffe)

Cache

Idealerweise enthält ein möglichst kleiner Zwischenspeicher die als nächstes benötigten Daten, damit schneller auf sie zugegriffen werden kann.
Aber was wird als nächstes benötigt?

zeitliches Lokalitätsprinzip: vor kurzem verwendete Daten
räumliches Lokalitätsprinzip: benachbarte Daten zu zuvor verwendeten

Wie geht dann Schreiben? 2 Möglichkeiten:

Schreiben in den Cache (bei Löschen aus Cache auch Hauptspeicher updaten)
Schreiben in den Hauptspeicher (bei Lesen aus Cache neu aus Hauptspeicher holen)

Was wird wo im Cache gespeichert?
Einteilung Speicheradresse in

Tag	Index	Offset
Alias von Zeile	ID von Speichermenge	innerhalb von Zeile
$b i t s_{g e s} - b i t s_{i n d e x} - b i t s_{o f f s e t}$	$\log_{2} (n_{S e t s})$	$\log_{2} (Z e i l e n l ä n g e)$

a s s o z i t i v i t ä t = \frac{n_{Z e i l e n}}{n_{S e t s}}

Cache-Kohärenz

Problem:

Prozessor A liest Wert mit Adresse 1 aus Hauptspeicher und legt ihn in seinen Cache
Prozessor B schreibt auf Adresse 1 im Hauptspeicher
-> Prozessor A hat falschen Wert im Cache!
Lösung:MESI-Protokoll
Jeder Prozessor merkt sich für jede Adresse, die er im Cache hat, einen der folgenden Zustände
Exclusive:
- Nur ich habe diese Adresse im Cache
- mein Wert im Cache ist valid (entspricht dem Hauptspeicher)
Shared:
- Auch andere haben diese Adresse im Cache
- mein Wert im Cache ist valid
Modified:
- Auch andere haben diese Adresse im Cache
- mein (neuer, von mir modifizierter) Wert im Cache ist valid
- andere haben noch den alten, invalid Wert
Invalid:
- Auch andere haben diese Adresse im Cache
- in meinem Cache ist ein veralteter, invalid Wert
- ich muss mir beim nächsten Zugriff den neuen valid aus dem Hauptspeicher holen

Spezialfälle

Direct Mapped

$a s s o z i a t i v i t ä t = 1$ -> $n_{Z e i l e n} = n_{S e t s}$
Pro Index-Bit Belegung existiert nur 1 Zeile (das zugehörige Set hat nur 1 Zeile)
-> Es kann nur maximal eine Hauptspeicherzeile mit dieser Belegung im Cache sein
-> Conflict-Miss-City (passieren dauernd)

Voll-Assoziativ

$a s s o z i a t i v i t ä t = n_{Z e i l e n}$ -> $n_{S e t s} = 1$
Es gibt nur ein einziges Set, wo jede Hauptspeicherzeile whereever hin kann, weil sie mit ihrem Tag identifiziert wird.
-> Es kann keine #Conflict Misses geben

Misses

Generell: Gesuchte Zeile ist momentan nicht im Cache und muss aus dem Hauptspeicher geholt werden (-> delay)

Cold Miss

Gesuchte Zeile war noch nie im Cache, also muss sie obv aus dem Hauptspeicher geholt werden.

Conflict Miss

Gesuchte Zeile war mal im Cache. Aber sie wurde von anderer Zeile vertrieben, und das obwohl es damals in anderen Sets noch Platz gegeben hätte. Also wäre das in einem voll-assoziativen Cache nicht passiert.

Capacity Miss

Gesuchte Zeile war mal im Cache. Aber sie wurde von anderer Zeile vertrieben, und es wäre auch nirgends sonst noch Platz gewesen. Also wäre das in einem voll-assoziativen Cache auch passiert.

Memory Access Time

A v g M e m o r y A c c e s s T i m e = H i t R a t e \cdot H i t L a t e n c y + M i s s R a t e \cdot M i s s L a t e n c y

H i t R a t e + M i s s R a t e = \frac{H i t s}{T o t a l A c c e s s e s} + \frac{M i s s e s}{T o t a l A c c e s s e s} = 1

Speicherhierarchie

Hauptspeicher -> L1 -> L2 -> L3
Inklusiv: Alle Daten aus Layer auch in untergeordneten
oder
Exklusiv: Gegenteil, jedes Datum nur in einem Layer

6.A Boolesche Algebra

easy clap tbh

Aussagenlogik

Dualer Ausdruck: $F^{D}$ , sozusagen das Gegenteil eines Ausdrucks
Bilden mit: $1 := 0$ , $0 := 1$ , $\lor := \land$ , $\land := \lor$

Wahrheitstabellen

Boolesche Algebra

Boolesche Ausdrücke

6.B +/- (Addierer & Subtrahierer)

Beschreibung von Schaltungen

Multiplexer

Basically switch case, 1 Entscheidungseingang und lauter nummerierte Eingänge, von denen der Entscheidungseingang einen aussucht.
In Klausur immer die Nummerierung der Eingänge hinschreiben!

Addierer

Subtrahierer

7.A * (Multiplizierer)

Paralleler Multiplizierer

Multiplizierer mit Carry-Save-Addierer

ALU

7.B Speichern

Sequenzielle Schaltungen

RS-Latch

D-Latch

Latch -> "latched" onto E (meist Clock), bei E=1 wird D "geschrieben", sonst behält es den letzten valid Zustand

D-FlipFlop

FlipFlop -> "schreibt" nur exakt beim Wechsel von E (meist Clock) von 0 auf 1 (bzw. 1 auf 0), sonst behält es den letzten valid Zustand.

Schieberegister

Speicher

Single-Cycle

Decode

Name	Bits	Verwendung
op	7	Instruktionsformat (für Main Decoder)
func-3 und func-7	3 und 7	ALU-Operation (mit Opcode)
rd	5	register destination
rs1 und rs2	5 und 5	register source
imm	$\geq$ 12	Immediate

?

Logic Hazards

BDD (Binary Decision Diagram)

Reduktionen

S-Reduktion
stupid Knoten, der mit allem auf anderen zeigt, kann weg
I-Reduktion
isomorphe Knoten, die sich gleich verhalten, kann man kombinieren

Shannon-Transformation

Funktion: Formel -> BDD
Wir nehmen immer die entsprechend der Variablenordnung kleinste Variable und erzeugen zwei neue Branches, für die beiden Belegungen der Variable. Auf die neuen Knoten schreiben wir die neue Formel (mit belegter Variable). Das machen wir so lange bis es keine Variablen mehr gibt. Dann nur noch #Reduktionen benutzen, um zu "kürzen". Fertig ist der Baum!

ITE-Verfahren

Hat NICHTS mit ITE-Operator an sich zu tun

Idk wer sich dachte, dass man das so nennen soll. Nicht verwirren lassen, wenn man mit dem ITE-Verfahren 3 Bäume mit dem ITE-Operator kombinieren soll.

Funktion: BDDs kombinieren mithilfe beliebiges Operators

Jeden Knoten unique benennen
Wir starten bei jedem Baum mit dem jeweils obersten Knoten
Loop (solang bis der Wert der Formel feststeht)
- Neuen Knoten unseres neuen Baums erstellen
  - Mit zugehöriger Formel (Operator auf Knoten der Bäume angewendet)
  - Wenn es den Knoten mit der Formel schon gibt, können wir ihn wiederverwenden!
- Bei niedrigste(n) Variablen (gemäß Ordnung) eins runtergehen, um nächste Knoten zu finden
Wenn wir einen festen Wert haben, verweist die entsprechende Kante einfach auf 1 oder 0
Dann gehen wir im zu erstellenden Baum so lange hoch, bis ein Pfad fehlt und wieder Loop
#Reduktionen benutzen, um Baum zu "kürzen"

Tseitsin-Transformation

Funktion: Schaltungen auf Äquivalenz Prüfen

$F = S c h a l t u n g 1 \oplus S c h a l t u n g 2$
wenn $F$ erfüllbar ist (also wenn es $\geq 1$ Belegung gibt wo True rauskommt), sind die Schaltungen nicht Äquivalent!
-> Um das zu testen, kann man $F$ noch in KNF überführen.Dafür
erstellt man den Syntax-Baum (mit der $S c h a l t u n g$ direkt geht eigentlich auch)
benennt jede Abzweigung mit einer Variable $a_{n}$
formuliert $F \land (F \leftrightarrow a_{0}) \land (a_{0} \leftrightarrow \dots) \land \dots$
Das kann man dann noch in KNF auflösen:
$A \leftrightarrow B$
$\equiv (A \to B) \land (B \to A)$
$\equiv (\neg A \lor B) \land (\neg B \lor A)$
(ggf. deMorgan anwenden)

Steinerbaum

verbindet alle Terminale in
zusammenhängendem Graphen

Erstellen

Hanaan-Punkte finden
alle die auf Spalte und Zeile von Terminalen liegen
Kürzesten Pfad zwischen zwei Terminalen finden
auf den beiden Möglichkeiten verbinden (links und rechtsrum)
Alle Hanaan-Punkte auf diesen Verbindungen markieren
Kürzesten Pfad zwischen Hanaan-Punkt und nächstem Terminal finden (-> 3.)
-> Wenn alle verbunden sind, sind wir fertig yay!

Optimierter Steinerbaum

Nur weil wir einen Steinerbaum haben, hat der noch nicht die minimalen Kosten. Dabei handelt es sich dann um ein (NP-hartes) MILP-Problem

LP und MILP

LP aka Linear Programming (easy)

Unter Beachtung linearer Bedingungen (z.B. $x_{1} + x_{2} > 4$ ) möglichst kleinen Wert für eine Formel $f (x_{1}, \dots x_{n})$ finden. Meist sind einige Variablen der Lösung nicht ganzzahlig.

MILP aka Multiple Integer Linear Programming (nicht so easy (NP-hart))

Wie LP aber zudem muss eine bestimmte Teilmenge der Variablen ganzzahlig sein.

LP-Lösung finden
ist sie auch MILP-Lösung?
- ja -> perfekt, nächste Lösung finden (-> 1.)
- nein -> Werte "runden"
  - indem wir für jeden zu rundenden Wert $x_{p}$ zwei neue LP-Bedingungen adden
  - und zwar $x_{p} \geq u p p e r B o u n d$ und $x_{p} \leq l o w e r B o u n d$
  - So schließen wir den nicht-ganzzahligen Problembereich für diesen Wert quasi aus
  - dann mit neuen Bedingungen dabei von vorne (-> 1.)
Sobald wir alle MILP-Lösungen haben, die mit minimalen Kosten nehmen!

1. Einführung und Datenrepräsentation Datei

Datendarstellungen

Binär

Abstraktionsebenen

2. Assemblersprachen Allgemein

C-Kompilierung

ISA

Komplexität

2,5. RISC-V

Befehlsklassen

arithmetische und logische Operationen

Addition/Subtraktion

Multiplikation/Division (nur mit M-Erweiterung)

Logische Operationen (bitwise)

Schiebebefehle

Floating Point Arithmetik

Datentransfer

Steuerung des Programmlaufs

Unbedingter Sprung

Bedingter Sprung

Unterprogramm

Speicher

Register

Hauptspeicher (Arbeitsspeicher)

Data alignment

Endianness

Aufbau

Sign-Extension

Calling Convention

Argumente/Return

Einzelnes Argument

Argumente insgesamt

Return

Caller-/Callee-Saved

Aufbau Programm/Routine

3. Architekturen

Von-Neumann-Architektur

Harvard-Architektur

4.A Andere ISAs

4.B Systemarchitektur

Mehrbenutzersysteme

Privilegienstufen

Systemaufruf

Interrupts vs. Traps/Exceptions

5. Speicherverwaltung & Caches

Virtueller Speicher (Paging/Mehrere Adressräume)

Herausforderungen und Einsatz von Virtuellem Speicher

Cache

Cache-Kohärenz

Spezialfälle

Direct Mapped

Voll-Assoziativ

Misses

Cold Miss

Conflict Miss

Capacity Miss

Memory Access Time

Speicherhierarchie

6.A Boolesche Algebra

Aussagenlogik

Wahrheitstabellen

Boolesche Algebra

Boolesche Ausdrücke

6.B +/- (Addierer & Subtrahierer)

Beschreibung von Schaltungen

Multiplexer

Addierer

Subtrahierer

7.A * (Multiplizierer)

Paralleler Multiplizierer

Multiplizierer mit Carry-Save-Addierer

ALU

7.B Speichern

Sequenzielle Schaltungen

RS-Latch

D-Latch

D-FlipFlop

Schieberegister

Speicher

Single-Cycle

Multiplikation/Division (nur mit `M`-Erweiterung)