# Modul 02 : Innebygde data typer og looper 

Denne modulen dekker i all hovedsak Kap. 2 fra lærekoken. 

Data typer er *viktig* i alle programmeringsspråk. 

Python har mange innebygde (built-in) [data typer](https://www.w3schools.com/python/python_datatypes.asp) (se også [denne linken](https://docs.python.org/3/library/stdtypes.html)).

Vi starter med en liten oversikt før vi nedenfor vil diskuter noen av dem i mer detalj.


## Boolean uttryk

En boolean data type tar verdiene *True* eller *False*, og flere variable kan kombineres via operatorer for å lage en ny slik data type.
Se [denne informasjonen](https://docs.python.org/3/library/stdtypes.html)) for deres sentrale egenskaper. Vennligst studer denne siden vi har bare gir noen få eksempler.

In [None]:
x = True
y = False

print( x and y )
print( x or y )
print( not x ) 


**Sammenligknings operatorer**

In [None]:
# Verdier
a = 2
b = 3
# Sammenlikning
print( a == b )
print( a < b )
print ( a != b )

## Numeriske typer

Følgende numeriske typer finnes in Python:

* int
* float
* complex

I standard Python (uten moduler), er alle float typer default i 64-bits (eller 8-bytes), dvs i dobbel presisjon. I motsetning til de fleste andre språk, finnes ikke single presisjon float. Tilsvarende består complex  av to 65+bits floats (eller hva som ofte kalles for complex 128). **Merk** numpy module har b[de single (float) og dobbel presisjons (float64) typer og tilsvarende for complex.

In [None]:
# De fleste alle floats kan ikke representeres eksakt
a = 0.1 + 0.2
b = 0.3
#
# 
# Hva er outputen fra denne kommandoen?
print(a == b)
#
print( " a = %25.18f " % a)
print( " b = %25.18f " % b)

**WARNING**: IKKE sammenlign floats!


## Range funksjonen

Range er en innebygd funksjon i Python som genererer en sekvens av tall (heltall). Denne funksjonen brukes mye ifm for-looper.  Syntaksen til funksjonen er $range([start],slutt,[step])$ 

In [None]:
N = 5
r1 = range(N)                        # tall fra 0 til, og IKKE med, N, dvs tallene 0,1,....N-1
r2 = range(1,6)
r3 = range(0,10,2)
#
print( r1 )
#
for tall in r1:                      # Vår første for-loop
    print("tall = ",tall)

La oss nå bruke dette til å regne ut N-fakultet, dvs,
\begin{align*}
   N! 
   &=
   \prod_{n=1}^N n
   = 1 \cdot 2 \cdot \ldots \cdot N. 
\end{align*}
Denne beregningen for $15!$ kan gjøres på følgende måte:

In [None]:
N = 15
fact = 1
for n in range(1,N+1):
    fact *= n
# end for
print( " %2d! = %10d " % (N,fact) )    

Men er dette store tallet det riktig svaret? Vi bruker en innebygd funksjon fra modulen math for å undersøke dette?

In [None]:
import math
fact_math = math.factorial(15)              # bruker math.factorial
feil      = fact_math - fact                # feil
#
print("%2d! = %10d !!!" % (N, fact_math) )  
if feil == 0:
    print("Svaret er RIKTIG(!) og feilen er %2d " % feil)
else:   
    print("Svaret er FEIL(!) Feilen er %2d " % feil)
# end if 

## Lister

Lister er en data type i Python som kan brukes til å lagre mer-eller-mindre hva det skulle være. Denne vektor liknende typen, defines via  $[\ldots ]$.

In [None]:
# En tom liste
tom =[]
# Liste med elementer av ulik type
list = [ 1, 2., 1+2j, 'tekst']
#
print(tom)
print(list)

In [None]:
# Man kan også ha lister av lister som vist her
a = 1
b = 100.
List =[a, b, list]
#
print(List)

Elementene i lister, og andre array liknende data typer, referere til via en index. For å referere til første element i en listen $L$ bruker Python **index verdien 0** (zero-based indexing), dvs. $L[0]$ og siste element har indeksen $N-1$ ($L[N-1]$) hvor $N$ er antall elementer i listen. Denne måten å referere til elementene i en liste (og andre array typer) på er vanlig i flere programmeringsspråk som C og C++. Merk deg at indekseringen som Python bruker er *forskjellig* fra hva man bruker i matematikken. Programmeringsspråk som bruker one-based indexing, slik som man gjør i matematikken, er Matlab, Fortran og Julia.   

In [None]:
# Antall elementer
N=len(list)
# Første element
first = list[0]
# Siste element
last = list[N-1]
#
print(N)
print(first)
print(last)


In [None]:
# Du kan også hente ut en range av element
print( list[1:3] )

# eller alle elementer utenom de n siste leddene
n = 1
print( list[:-n] )         # merk minus tegnet her!

La oss nå legge til ett element til listen!

In [None]:
# Fra tidligere
list = [ 1, 2., 1+2j, 'tekst']
N = len(list)
# La oss legge til ett element på slutten av listen
list.append('Tillegg!')
M=len(list)
#
print("Antall elementer før tillegg var %2d og etter %2d ! " % (N,M) )
print(" list = ", list)

Det eksistere mange ulike funksjoner som kan brukes på lister og en oversikt finnes [her](https://docs.python.org/3/tutorial/datastructures.html). For raskt å få en kortfattet oversikt, skriv inn en liste variable (i code), samt legg til et punktum. Dette vil i code gi deg en list av de ulike mulig **member functions**. F.eks. for å så slette et element,  

In [None]:
# Få en oversikt over ulike member functions bruk list.
list. 

 F.eks. for å så slette et element gjør man

In [None]:
list = [ 1, 2., 1+2j, 'tekst']
print("Før : ", list)
# Fjern element no 2 fra listen
list.pop(2)
print("Etter : ", list) 

In [None]:
# Alternativt kan man bruke del funksjonen til å fjerne et element
list = [ 1, 2., 1+2j, 'tekst']
print("Før : ", list)
# Alternativ måte: Fjern element no 2 fra listen 
del list[2]
print("Etter : ", list) 

**Spørsmål**: 
* Hva gjør koden  list.remove(2)?
* Hvordan legge til et nytt element no 2 til list?


### Kopiering av lister (og mange andre array data typer)

Her er det lett å gjøre feil.... Så vi vil diskutere dette her.  

In [None]:
# Først for "vanlige" numeriske data typer, f.eks. en int
a = 1
b = a
# Oppdater b
b += 2
#
print("Som forventet er a = %2d og b = %2d " % (a,b) )

Derimot for lister har vi:

In [None]:
A = [ 1, 2., 1+2j, 'tekst']
B = A
# Legg til et nytt element til B
B.insert(2, 100+200j)
#
print("List A = ",A )
print("List B = ",B )

In [None]:
# For hjelp med insert funksjonen, prøv følgende:
help( list.insert )

**Spørsmål**: Hva er de to eksemplene så forskjellige?

In [None]:
# For heltallene a og b
print( id(a), id(b) )
#
# For listene A og B
print( id(A), id(B) )

In [None]:
# For å oppnå det du ønsker kan du gjøre
A = [ 1, 2., 1+2j, 'tekst']
B = A.copy()
B.insert(2, 100+200j)
#
print("List A = ",A )
print("List B = ",B )
#
print( id(A), id(B) )

For ytterliger informasjon om lister BØR du studere [dette materialet](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists).

**Kommentar**: Lister kan med første øyekast virke som en god og generell data type som man f.eks. kan bruke som en generell array klasse når man skal gjøre numeriske beregninger eller data analyse. Selv om det er fult mulig å bruke lister til dette formålet, så er bakdelen at denne data typen ikke er spesielt effektiv. Vi vil se at array typen fra Numerical Python (numpy) har en ytelse som langt overgår den for lister. Derfor er det numpy.array data typen vi vil bruk mest i dette emnet når vi senere skal håndtere numeriske data. 

### Loope over elementene i en liste

Det er essensielt to hovedmetoder for å loope over elementene i en list (som er likeverdige). Et par eksempler vil bli brukt til å illustrere deres bruk.  

In [None]:
# Metode 1: direkte metoden
for element in B:
    print( element )
# end for    

In [None]:
# Metode 2: Indirekte metode via range
for i in range( len(B) ):
    print( B[i] )
# end for    

In [None]:
# En annen bruk av en for-loop
list2 = [ n for n in range(5) ]
print(list2)

### Ploting av numeriske vedier i en liste

Numerisk innholdet i lister kan man presenter grafisk. Standard måten å gjøre det på er ved hjelp av modulen *matplotlib*. For å få tilgang til denne må man importere denne modulen først. Nedenfor vil vi presentere hvordan man plotter funksjonen $f(x)=x^n$ for $n=2,3$. Mer informasjon om matplotlib kan du finner her [her](https://www.w3schools.com/python/matplotlib_intro.asp). 

Du bør merke deg at du vanligvis IKKE vil bruke lister til dette formålet, men der numpy.arrays som vi vil lære om senere.

In [None]:
import matplotlib.pyplot as plt       # import av modulen

x = range(15)                         # x verdier
y2 = [ xn*xn    for xn in x ]         # y = x^2
y3 = [ xn*xn*xn for xn in x ]         # y = x^3

print(x)
print(y2)

In [None]:
plt.plot(x,y2)
# 
plt.title("Et enkelt test plot")         # dekorer plottet
plt.xlabel("x")
plt.ylabel(r"$f(x)=x^2$")

#plt.show()                              # I script å du ha med denne linjen

In [None]:
plt.plot(x, y2, "-b", label="n=2")
plt.plot(x, y3, "-r", label="n=3")

plt.title("Et annet test plot")         # dekorer plottet
plt.xlabel("x")
plt.ylabel(r"$f(x)=x^n$")
plt.legend()

#plt.show()

Senere vil du bruke plotte funksjonen mye, så dette er det verdt å bruke noe tid på å mestre. Som sagt vil vi typisk bruke numpy.arrays for a lagre data som vi skal plotte. For å foregripe begivenhetene noe brukes plt.plot funksjonen via numpy på følgende måte

In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-0.75,1,100)                     # en np.array fra og med 0.75 til og med 1 med 100 punkter
y0 = np.exp(2 + 3*x - 7*x**3)
y1 = 7-4*np.sin(4*x)

plt.plot(x,y0,x,y1)
plt.legend(('y0','y1'))
#plt.legend((r'$y_0$', r'$y_1$'))                  # Nicer via LaTeX   (bruk $<math>$)
# 
plt.show()



## Tuples

En *tuple* er en data type definert via $T=(\ldots)$ og elementene er adskilt via komma. 

In [None]:
# En tom tuple
tom = ()
print(type(tom))
# En ikke tom tuple
tuple = ( 1, 2, 'test')
print(tuple)
# antall elementer
print( len(tom), len(tuple))
#
# Streng tatt er det til

In [None]:
# Streng tatt trenger du ikke parentesene
tuple2 =  1, 2, 'test'
print(tuple2)
# eller
t = 1,
print(t)

In [None]:
# elementer i en tuple hentes ut på samme måte som for lister
print( tuple2[1] )
# S
# det samme gjelder for antall elementer i tuplen
print( len(tuple2) )

In [None]:
# Definisjoner
list = [ 1, 2., 1+2j, 'tekst']
tuple = ( 1, 2., 1+2j, 'tekst' )

# SPØRSMÅL: Hva skjer her?
list[1] = 3.
tuple[1] = 3.

Det er mange likheter mellom lister og tuples. Så hvorfor trenger vi dem begge? 

Hovedforskjellen mellom dem, utover forskjell i syntax, er at innholdet i lister **kan endres** mens innholdet i tuples **IKKE kan endres**! Sistnevnte data type er derfor best egnet for statiske data.

I data språket sier man ofte:

* *Lists are mutable*: This means their elements can be changed (added, removed, or modified) after the list has been created.
* *Tuples are immutable*: Once a tuple is created, its elements cannot be changed. This makes them suitable for representing fixed collections of data.

Hvordan bruke lister of tuples:

* Lists are ideal for dynamic collections: where elements need to be frequently added, removed, or modified (e.g., a shopping cart, a list of user preferences).
* Tuples are suitable for fixed collections of data: that should not change (e.g., coordinates, API responses, database records, or as dictionary keys). 
Tuples can also be used when data integrity is crucial.




## Sets

Sets er en annen data type i Python. Den defineres via krøll-parenteser $S=\{ \ldots \}$ og dataene som inngår i et set skilles via komma. *Merk* et tomt set defineres IKKE via 
$\{\ldots \}$ (reservert for dictionaries (se senere)). Derimot må du bruke set().


In [None]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)                      # show that duplicates have been removed

In [None]:
a = set('abracadabra')
b = set('alacazam')
#
a                                  # unique letters in a
# {'a', 'r', 'b', 'c', 'd'}
a - b                              # letters in a but not in b
# {'r', 'd', 'b'}
a | b                              # letters in a or b or both
# {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
a & b                              # letters in both a and b
# {'a', 'c'}
a ^ b                              # letters in a or b but not both
# {'r', 'd', 'b', 'm', 'z', 'l'}

Mer informasjon om [tuples og sets](https://docs.python.org/3.13/tutorial/datastructures.html#tuples-and-sequences).

## Dictionaries

Dictionary er en annen nyttig data type i Python og en tom variable $D$ av denne typen kan defines via $D=\{\ldots \}$. Elementene av denne data type refereres til via via såkalte *keys*, og ikke indeks verdier slik som er tilfelle for f.eks. lister og tupler.   

In [None]:
tom = {}                                    # En tom dictionary
dict = { 'one':1, 'two':2, 'three':3 }      # ikke tom dictionary
#
print( type(tom) )
print( dict )

In [None]:
keys   = dict.keys()                        # get keys 
values = dict.values()                      # get values   
#
print( keys )
print( values )

In [None]:
two = dict['two']                           # få tak i et spesifikt element....
Two = dict.get('two')                       # en alternativ metode....
#
print( two )
print( Two )

In [None]:
dict['four'] = 4                            # legger til et nytt (key,value) par.
#
print( dict )
# 
tillegg = {'five':5}
dict.update( tillegg )                      # alternative metode (om key eksisterer blir det ev. en oppdatering )
#
tillegg2 = {'two':2 }
dict.update( tillegg2 )  
#
print( dict )

In [None]:
# Alternativ metode til dict.update()
dict1 = {'name': 'Alice', 'age': 25}
dict2 = {'city': 'New York', 'email': 'alice@example.com', 'age':32}
#
dict3 = dict1 | dict2          # Kombinere to dictionary
#
dict4 = dict1.copy()           # lager en kopi av dict1
dict4 |= dict2                 # Update dict1 in-place using the update |= operator
#                              # key age is updated
print( dict3 )
print( dict4 )

Det finnes mange ulike og kraftfulle metode funksjoner knyttet til dictionary. Finn noen gode resurser online for å studere disse. En start kan du finne [her](https://docs.python.org/3.13/tutorial/datastructures.html#dictionaries). 

## Looper (eller løkker)

Det er flere typer av looper i Python. De sentrale er
* for-looper
* while-looper

In [None]:
# For-looper
for n in range(4):
    print(n)
# end for    

In [None]:
# While-loop
n=0
while n<4:
    print(n)
    n += 1
# end while    

## if statements


In [None]:
age = 20
#
MYNDIGHETS_ALDER = 18
#
if age <= MYNDIGHETS_ALDER:
    print("Jeg er ikke myndig!")
else: 
    print("Jeg er myndig!")
# end if    

Slike statements can be nøstet

In [None]:
age = 16
#
MYNDIGHETS_ALDER = 18
SKOLE_ALDER = 6
#
if age <= MYNDIGHETS_ALDER:
    print("Jeg er ikke myndig!")
    if age > SKOLE_ALDER:
        print("  ... men går på skolen")
    # end if    
else: 
    print("Jeg er myndig!")
# end if    

In [None]:
age = 15
#
if age <= 3:
    print("Jeg er en baby!")
elif age <= 12:
    print("Jeg er et barn!")
elif age <= 19:
    print("Jeg er en teenager!")
else:
    print("Jeg er arbeidsfør alder eller pensjonist!")
# end if    